Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:playlang [2011/01/26 13:47] ufal |
user:hladka:playlang [2011/01/28 12:31] ufal |
||
---|---|---|---|
Line 249: | Line 249: | ||
- Ve výsledném naparsovaném souboru jsem rozpoznal základní pojmenované entity - kombinace cizích a mých vlastních modulů TectoMT; prozatím v PlayCoref neumíme zpracovat vnořené entity, a tak jsem použil opravdu jen základní moduly, vynechal jsem např. spojení přívlastků vlastních s podstatnými jmény. (Použitý scénář: '' | - Ve výsledném naparsovaném souboru jsem rozpoznal základní pojmenované entity - kombinace cizích a mých vlastních modulů TectoMT; prozatím v PlayCoref neumíme zpracovat vnořené entity, a tak jsem použil opravdu jen základní moduly, vynechal jsem např. spojení přívlastků vlastních s podstatnými jmény. (Použitý scénář: '' | ||
- Nalezené pojmenované entity jsem vyextrahoval pomocí skriptu '' | - Nalezené pojmenované entity jsem vyextrahoval pomocí skriptu '' | ||
- | - Pak nastává převod do formátu PDT. Používám skript z TectoMT-> | + | - Pak nastává převod do formátu PDT. Používám skript z TectoMT-> |
- | '' | + | * '' |
- | '' | + | * '' |
- | V takto získaných datech je ještě potřeba upravit identifikátory. | + | * V takto získaných datech je ještě potřeba upravit identifikátory |
=== Převod pro Shannona a Place the Space === | === Převod pro Shannona a Place the Space === | ||
- | Je potřeba převádět jinak - v TectoMT (nebo při převodu do PDT formátu) se ztrácí informace o přítomnosti mezery. | + | Je potřeba převádět jinak, neboť |
+ | |||
+ | **Pro češtinu** proto používám tool-chain z projektu ČAK. Bohužel mi nefunguje (a nevím proč) tool-chain až na a-rovinu, a tak ho používám jen na m-rovinu, navíc jen v csts. Ale to pro tyto účely stačí! Vstupní text musí být v ISO-LATIN-2, | ||
+ | |||
+ | Vzniklý csts soubor převedu do UTF-8, pomocí skriptu PlayLang->'' | ||
==== Zobrazení v Tredu: ==== | ==== Zobrazení v Tredu: ==== |