[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:joshua [2009/06/02 22:03]
zeman Extrakce gramatiky.
user:zeman:joshua [2009/06/02 23:37]
zeman
Line 107: Line 107:
     --maxPhraseLength=5 \     --maxPhraseLength=5 \
     --print-rules=false</code>     --print-rules=false</code>
 +
 +Pozor, je poměrně snadné vyčerpat paměť. Tomu se dá čelit jednak tím, že se přesuneme na stroj, který má více paměti, jednak že zvolíme postup, který je složitější, ale k paměti šetrnější.
 +
 +Binarizovat zdrojovou část korpusu.
 +
 +<code>java -cp bin joshua.corpus.suffix_array.SuffixArray $WORK/corpus/train.clean.en $WORK/model/vocab.en.bin $WORK/model/corpus.en.bin $WORK/model/suffixes.en.bin</code>

[ Back to the navigation ] [ Back to the content ]