[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:preklad-morfemu [2010/12/15 15:24]
zeman
user:zeman:preklad-morfemu [2010/12/15 15:29]
zeman Umístění souborů.
Line 19: Line 19:
  
 Verze v TectoMT obsahuje moje úpravy Morfessora (např. práce s texty v UTF-8) a také můj obalovací skript ''train.pl''. Verze v TectoMT obsahuje moje úpravy Morfessora (např. práce s texty v UTF-8) a také můj obalovací skript ''train.pl''.
 +
 +===== Umístění souborů =====
 +
 +Umístění programových souborů Morfessora nebo s Morfessorem souvisejících je popsáno výše.
 +
 +Paralelní data, na která se to celé bude aplikovat, typicky leží v příslušné složce ''augmented_corpora''. Předpokládám, že tam také budou ležet segmentované verze těchto korpusů po průchodu Morfessorem.
 +
 +Pracovní složka pro Morfessora a všechna data, která souvisejí s konkrétním jazykem, ale nikoli s konkrétním korpusem pro tento jazyk, by měla ležet jinde. Asi by to mohlo být ''/net/work/people/zeman/morfessor'', kam by se přesunuly i současné složky ''cslex'' a ''enlex''.
  
 ===== Předzpracování paralelních dat Morfessorem ===== ===== Předzpracování paralelních dat Morfessorem =====

[ Back to the navigation ] [ Back to the content ]