Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:preklad-morfemu [2010/12/15 13:45] zeman Kde leží Morfessor. |
user:zeman:preklad-morfemu [2010/12/15 13:57] zeman Předzpracování paralelních dat. |
||
---|---|---|---|
Line 22: | Line 22: | ||
Verze v& | Verze v& | ||
+ | |||
+ | ===== Předzpracování paralelních dat Morfessorem ===== | ||
+ | |||
+ | Morfessor čte frekvenční slovník (na každém řádku četnost, mezera, slovo). Nejdříve mu ho tedy musíme vyrobit z& | ||
+ | |||
+ | Pak ještě potřebujeme program, který načte Morfessorem navržené dělení trénovacích slov, zapamatuje si ho a aplikuje ho na libovolný tokenizovaný vstupní text. Tímto programem potom proženeme naše paralelní data. | ||