[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:wmt [2012/02/27 16:02]
zeman Problémy se značkováním korpusů OSN.
user:zeman:wmt [2012/02/28 11:19]
zeman Aktualizace úkolů: data pro páry s češtinou jsou hotová.
Line 13: Line 13:
   * Všechny přípravy korpusů a zarovnání zopakovat i pod Emanem. Naučit se registrovat korpusy Corpmanem.   * Všechny přípravy korpusů a zarovnání zopakovat i pod Emanem. Naučit se registrovat korpusy Corpmanem.
   * Připravit data pro cs-de, cs-es a cs-fr (news-commentary+europarl.v7).   * Připravit data pro cs-de, cs-es a cs-fr (news-commentary+europarl.v7).
 +    * Data už jsou připravena, ale zatím se rozeběhla jen polovina pokusů (běží cs-de, cs-es, cs-fr, neběží de-cs, es-cs, fr-cs).
   * Prohnat všechna data Morfessorem a vyhodnotit překlad s ním.   * Prohnat všechna data Morfessorem a vyhodnotit překlad s ním.
   * Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10).   * Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10).

[ Back to the navigation ] [ Back to the content ]