Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:wmt [2012/02/04 23:41] zeman Jak označkovat newstest. |
user:zeman:wmt [2012/02/07 14:47] zeman Doběhlo cs-en v7. |
||
---|---|---|---|
Line 8: | Line 8: | ||
===== Aktuální úkoly ===== | ===== Aktuální úkoly ===== | ||
+ | * V Emanovi zařídit, abych počítal BLEU skóre přesně stejným způsobem jako Ondra. | ||
* Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10). | * Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10). | ||
* Otestovat jiná vývojová data (k dispozici je newstest 2008, 2009 a 2010, nebo všechny dohromady). | * Otestovat jiná vývojová data (k dispozici je newstest 2008, 2009 a 2010, nebo všechny dohromady). | ||
* Otestovat morfematickou segmentaci (ale musí se doimplementovat závěrečné slepování). | * Otestovat morfematickou segmentaci (ale musí se doimplementovat závěrečné slepování). | ||
- | * Dotáhnout do konce pokusy s uvozovkami (v6b), včetně testovacích dat. | ||
* Zopakovat tytéž pokusy, ale nad letos distribuovanými daty (v7). | * Zopakovat tytéž pokusy, ale nad letos distribuovanými daty (v7). | ||
* Pro všechny jazykové páry používat všechna dostupná data. Například velký Czeng pro češtinu, velké korpusy UN pro francouzštinu a španělštinu, | * Pro všechny jazykové páry používat všechna dostupná data. Například velký Czeng pro češtinu, velké korpusy UN pro francouzštinu a španělštinu, | ||
Line 106: | Line 106: | ||
Pokusy s& | Pokusy s& | ||
- | Nový průběh všech osmi starých pokusů (supervised truecasing, žádná normalizace uvozovek, nové je na nich paralelní počítání alignmentu, ale výsledek by měl být identický – nekontroloval jsem): '' | + | Nový průběh všech osmi starých pokusů (supervised truecasing, žádná normalizace uvozovek, nové je na nich paralelní počítání alignmentu, ale výsledek by měl být identický – nekontroloval jsem): '' |
- | ^ Jazyky ^ v6 ^ v6b-tr ^ v6b ^ | + | ^ Jazyky ^ v6 ^ v6b-tr ^ v6b ^ v7 ^ |
- | | en-cs | 0.1191 | 0.1246 | | | + | | en-cs | 0.1191 | 0.1246 |
- | | cs-en | 0.1692 | 0.1792 | | | + | | cs-en | 0.1692 | 0.1792 | 0.1801 | 0.1814 |
- | | en-de | 0.1337 | 0.1274 | | | + | | en-de | 0.1337 | 0.1274 |
- | | de-en | 0.1885 | 0.1859 | | | + | | de-en | 0.1885 | 0.1859 |
- | | en-es | 0.2573 | 0.2531 | | | + | | en-es | 0.2573 | 0.2531 |
- | | es-en | 0.2446 | 0.2375 | | | + | | es-en | 0.2446 | 0.2375 |
- | | en-fr | 0.2591 | 0.2619 | | | + | | en-fr | 0.2591 | 0.2619 |
- | | fr-en | 0.2243 | 0.2285 | | | + | | fr-en | 0.2243 | 0.2285 |
===== Pokusy s Emanem ===== | ===== Pokusy s Emanem ===== |