[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:preklad-morfemu [2010/12/15 14:17]
zeman Předzpracování paralelních dat.
user:zeman:preklad-morfemu [2010/12/15 15:24]
zeman
Line 6: Line 6:
   * Předcházející pokusy proběhly v rámci přípravy výuky o neřízené morfematické segmentaci.   * Předcházející pokusy proběhly v rámci přípravy výuky o neřízené morfematické segmentaci.
     * /net/work/people/zeman/enlex     * /net/work/people/zeman/enlex
-    * Do nástrojů vede odkaz z enlex. 
-    * Přesto je novější verze v TectoMT. 
-    * Je v ní také můj skript train.pl. 
   * Rozebrat Morfessorem všechna anglická a česká trénovací, vývojová i testovací data.   * Rozebrat Morfessorem všechna anglická a česká trénovací, vývojová i testovací data.
     * Vybrat vhodný malý pokus s malými daty, na kterých se to provede.     * Vybrat vhodný malý pokus s malými daty, na kterých se to provede.
Line 35: Line 32:
   * ''$STATMT/scripts/freqdict.pl''   * ''$STATMT/scripts/freqdict.pl''
     * Pro Morfessor je ještě třeba prohodit sloupce (nejdřív četnost, pak slovo).     * Pro Morfessor je ještě třeba prohodit sloupce (nejdřív četnost, pak slovo).
-    * ''perl -pe 's/\r?\n$//; s/^(.*?)\t(\d+)/$2 $1\n/;' < freqdict.txt > formorfessor.txt''+    * <code perl>perl -pe 's/\r?\n$//; s/^(.*?)\t(\d+)/$2 $1\n/;' < freqdict.txt > formorfessor.txt</code>
   * Potom zavolat Morfessor:   * Potom zavolat Morfessor:
   * ''$TMT_ROOT/personal/zeman/morfessor/bin/train.pl < formorfessor.txt > freqdict.morfessor.txt''   * ''$TMT_ROOT/personal/zeman/morfessor/bin/train.pl < formorfessor.txt > freqdict.morfessor.txt''
   * To celé raději pouštět na clusteru.   * To celé raději pouštět na clusteru.
  

[ Back to the navigation ] [ Back to the content ]