This is an old revision of the document!
Table of Contents
Překlad morfémů
Zbývá udělat
- Znova rozchodit Morfessor.
- Předcházející pokusy proběhly v rámci přípravy výuky o neřízené morfematické segmentaci.
- /net/work/people/zeman/enlex
- Do nástrojů vede odkaz z enlex.
- Přesto je novější verze v TectoMT.
- Je v ní také můj skript train.pl.
- Rozebrat Morfessorem všechna anglická a česká trénovací, vývojová i testovací data.
- Vybrat vhodný malý pokus s malými daty, na kterých se to provede.
- Pozor! Pokud pustím Morfessora na malých datech, bude dávat horší výsledky, než když ho pustím na velkých!
- Pustit Joshuu včetně Gizy.
- Prozkoumat, co vypadlo z Gizy, protože to bude hlavní zajímavost do článku.
Morfessor
Morfessor mám momentálně na dvou místech:
/home/zeman/nastroje/morfessor
$TMT_ROOT/personal/zeman/morfessor
Verze v TectoMT je aktuálnější a ta druhá by se měla smazat nebo nahradit symbolickým odkazem. V TectoMT je také můj obalovací skript train.pl
.