Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:preklad-morfemu [2010/12/15 14:17] zeman Předzpracování paralelních dat. |
user:zeman:preklad-morfemu [2010/12/15 15:24] zeman |
||
---|---|---|---|
Line 6: | Line 6: | ||
* Předcházející pokusy proběhly v rámci přípravy výuky o neřízené morfematické segmentaci. | * Předcházející pokusy proběhly v rámci přípravy výuky o neřízené morfematické segmentaci. | ||
* / | * / | ||
- | * Do nástrojů vede odkaz z enlex. | ||
- | * Přesto je novější verze v TectoMT. | ||
- | * Je v ní také můj skript train.pl. | ||
* Rozebrat Morfessorem všechna anglická a česká trénovací, | * Rozebrat Morfessorem všechna anglická a česká trénovací, | ||
* Vybrat vhodný malý pokus s malými daty, na kterých se to provede. | * Vybrat vhodný malý pokus s malými daty, na kterých se to provede. | ||
Line 35: | Line 32: | ||
* '' | * '' | ||
* Pro Morfessor je ještě třeba prohodit sloupce (nejdřív četnost, pak slovo). | * Pro Morfessor je ještě třeba prohodit sloupce (nejdřív četnost, pak slovo). | ||
- | * '' | + | * <code perl>perl -pe ' |
* Potom zavolat Morfessor: | * Potom zavolat Morfessor: | ||
* '' | * '' | ||
* To celé raději pouštět na clusteru. | * To celé raději pouštět na clusteru. | ||