[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:giza [2009/06/02 12:14]
zeman Odstranění dlouhých vět.
user:zeman:giza [2009/06/02 13:18]
zeman
Line 21: Line 21:
  
 Zdá se, že nástroje přeložené na 32bitové pracovní stanici s Ubuntu lze spustit i na clusteru. Zdá se, že nástroje přeložené na 32bitové pracovní stanici s Ubuntu lze spustit i na clusteru.
- 
- 
- 
- 
  
 ===== Příprava dat ===== ===== Příprava dat =====
Line 51: Line 47:
  
 Ohlásilo to, že z 50000 vět zbylo 42737. Ohlásilo to, že z 50000 vět zbylo 42737.
 +
 +
 +
 +
 +
 +===== Volání Gizy =====
 +
 +Než zavoláme Gizu, musíme mít z nějakého důvodu hotový [[SRILM|jazykový model]]<nowiki>!</nowiki>
 +
 +Moses obsahuje skript, který hezky obaluje volání mkcls a Gizy++ a generuje frázové a přeskládávací tabulky, které potřebuje dekodér. Volá se takhle:
 +
 +<code>nohup nice $MOSES/tools/moses-scripts/scripts-20090128-1534/training/train-factored-phrase-model.perl \
 +    -scripts-root-dir $MOSES/tools/moses-scripts/scripts-20090128-1534/ \
 +    -root-dir work \
 +    -corpus ./train.lowercased -f en -e hi \
 +    -alignment grow-diag-final-and \
 +    -reordering msd-bidirectional-fe \
 +    -lm 0:3:../lm/train.lowercased.hi.lm \
 +    >& training.out &
 +</code>

[ Back to the navigation ] [ Back to the content ]