Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:wmt [2012/02/27 16:02] zeman Problémy se značkováním korpusů OSN. |
user:zeman:wmt [2012/02/28 13:30] zeman Doběhly zbývající pokusy s novými testovacími daty. |
||
---|---|---|---|
Line 13: | Line 13: | ||
* Všechny přípravy korpusů a zarovnání zopakovat i pod Emanem. Naučit se registrovat korpusy Corpmanem. | * Všechny přípravy korpusů a zarovnání zopakovat i pod Emanem. Naučit se registrovat korpusy Corpmanem. | ||
* Připravit data pro cs-de, cs-es a cs-fr (news-commentary+europarl.v7). | * Připravit data pro cs-de, cs-es a cs-fr (news-commentary+europarl.v7). | ||
+ | * Data už jsou připravena, | ||
* Prohnat všechna data Morfessorem a vyhodnotit překlad s ním. | * Prohnat všechna data Morfessorem a vyhodnotit překlad s ním. | ||
* Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10). | * Otestovat vliv omezení délky fráze na 5 tokenů (zkusit i default a 10). | ||
Line 108: | Line 109: | ||
Pokusy s& | Pokusy s& | ||
- | Nový průběh všech osmi starých pokusů (supervised truecasing, žádná normalizace uvozovek, nové je na nich paralelní počítání alignmentu, ale výsledek by měl být identický – nekontroloval jsem): '' | + | Nový průběh všech osmi starých pokusů (supervised truecasing, žádná normalizace uvozovek, nové je na nich paralelní počítání alignmentu, ale výsledek by měl být identický – nekontroloval jsem): '' |
- | ^ Jazyky ^ v6 ^ v6b-tr ^ v6b ^ v7 ^ | + | ^ Jazyky ^ v6 ^ v6b-tr ^ v6b ^ v7 ^ wmt12 ^ |
- | | en-cs | 0.1191 | 0.1246 | 0.1257 | 0.1299 | | + | | en-cs | 0.1191 | 0.1246 | 0.1257 | 0.1299 |
- | | cs-en | 0.1692 | 0.1792 | 0.1801 | 0.1814 | | + | | cs-en | 0.1692 | 0.1792 | 0.1801 | 0.1814 |
- | | en-de | 0.1337 | 0.1274 | 0.1334 | 0.1350 | | + | | en-de | 0.1337 | 0.1274 | 0.1334 | 0.1350 |
- | | de-en | 0.1885 | 0.1859 | 0.1896 | 0.1915 | | + | | de-en | 0.1885 | 0.1859 | 0.1896 | 0.1915 |
- | | en-es | 0.2573 | 0.2531 | 0.2627 | 0.2756 | | + | | en-es | 0.2573 | 0.2531 | 0.2627 | 0.2756 |
- | | es-en | 0.2446 | 0.2375 | 0.2497 | 0.2562 | | + | | es-en | 0.2446 | 0.2375 | 0.2497 | 0.2562 |
- | | en-fr | 0.2591 | 0.2619 | 0.2526 | 0.2729 | | + | | en-fr | 0.2591 | 0.2619 | 0.2526 | 0.2729 |
- | | fr-en | 0.2243 | 0.2285 | 0.2384 | 0.2448 | | + | | fr-en | 0.2243 | 0.2285 | 0.2384 | 0.2448 |
===== Pokusy s Emanem ===== | ===== Pokusy s Emanem ===== |