Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:playlang [2011/01/24 13:19] hladka |
user:hladka:playlang [2011/01/25 12:39] mirovsky |
||
---|---|---|---|
Line 238: | Line 238: | ||
== Převod rozšířené a-roviny do rozšířeného csts == | == Převod rozšířené a-roviny do rozšířeného csts == | ||
* '' | * '' | ||
+ | |||
+ | ==== Převod dat z prostého textu do formátu playlang: ==== | ||
+ | Využíváme analýzu v modulárním systému TectoMT. | ||
+ | |||
+ | Postup při zpracování české verze Studie v Šarlatové byl tento: | ||
+ | - Do textového souboru v UTF-8 jsem za nadpisy a čísla kapitol přidal tečku - konec věty; česká TectoMT analýza nadpisy nezná. | ||
+ | - Následně jsem použil aktuální verzi analýzy na tekto rovinu, která je k dispozici v TectoMT. | ||
+ | - Ve výsledném naparsovaném souboru jsem rozpoznal základní pojmenované entity - kombinace cizích a mých vlastních modulů TectoMT; prozatím v PlayCoref neumíme zpracovat vnořené entity, a tak jsem použil opravdu jen základní moduly, vynechal jsem např. spojení přívlastků vlastních s podstatnými jmény. | ||
+ | - Nalezené pojmenované entity jsem vyextrahoval pomocí skriptu '' | ||
+ | - | ||
==== Zobrazení v Tredu: ==== | ==== Zobrazení v Tredu: ==== |