Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:wmt [2012/02/09 21:10] zeman Doběhlo de-en v7. |
user:zeman:wmt [2012/02/27 12:28] zeman Aktualizace aktuálních úkolů. |
||
---|---|---|---|
Line 8: | Line 8: | ||
===== Aktuální úkoly ===== | ===== Aktuální úkoly ===== | ||
- | * V Emanovi zařídit, abych počítal BLEU skóre | + | |
+ | * Stáhnout a otestovat nová testovací data (WMT 2012). | ||
+ | | ||
+ | * Připravit data pro cs-de, cs-es a cs-fr (news-commentary+europarl.v7). | ||
+ | * Prohnat všechna data Morfessorem a vyhodnotit | ||
* Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10). | * Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10). | ||
- | * Otestovat jiná vývojová data (k dispozici je newstest 2008, 2009 a 2010, nebo všechny dohromady). | ||
- | * Otestovat morfematickou segmentaci (ale musí se doimplementovat závěrečné slepování). | ||
- | * Zopakovat tytéž pokusy, ale nad letos distribuovanými daty (v7). | ||
* Pro všechny jazykové páry používat všechna dostupná data. Například velký Czeng pro češtinu, velké korpusy UN pro francouzštinu a španělštinu, | * Pro všechny jazykové páry používat všechna dostupná data. Například velký Czeng pro češtinu, velké korpusy UN pro francouzštinu a španělštinu, | ||
* Převést všechny pokusy pod aktuální verzi Joshuy (ale bacha, možná bude hodně jiná). | * Převést všechny pokusy pod aktuální verzi Joshuy (ale bacha, možná bude hodně jiná). |