Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:wmt [2012/01/21 18:57] zeman wmt/experiments/en-cs/josh11/obo-max |
user:zeman:wmt [2012/01/25 22:49] zeman obo-max |
||
---|---|---|---|
Line 17: | Line 17: | ||
* Pro všechny jazykové páry používat všechna dostupná data, tedy i Europarl, neomezovat se na News Commentary. To mj. znamená, že musím pro všechny páry získat nové baseliny. | * Pro všechny jazykové páry používat všechna dostupná data, tedy i Europarl, neomezovat se na News Commentary. To mj. znamená, že musím pro všechny páry získat nové baseliny. | ||
- | ===== Srovnávací testy mezi Joshuou 1.1 a 1.3 ===== | + | ===== Srovnávací testy mezi Joshuou 1.1 a 1.3: Je třeba otestovat nastavení maximální délky fráze 5 ===== |
- | 21.1.2012 se vracím k pokusu '' | + | Po přechodu z Joshuy 1.1 na 1.3 u téměř |
- | ==== Staré záznamy ==== | + | ===== Staré záznamy |
- | Po přechodu z Joshuy 1.1 na 1.3 u téměř všech pokusů pokleslo BLEU skóre. Je to sice malý pokles a pravděpodobně není statisticky významný, ale stejně mě to zaráží. Srovnání u češtiny ukázalo, že se liší extrahovaná gramatika. V konfiguraci se už teď nezadává, že maximální délka fráze má být 5. Hraje to nějakou roli? | + | obo-max: testuje na wmt102.test09, staré BLEU = 0.l300 |
+ | obo-max3: testuje | ||
+ | Oba používají Joshuu | ||
+ | Oba používají Ondřejova velká data (7 miliónů párů vět z Czengu 0.92 na trénování, 13 miliónů českých vět (210 miliónů slov) pro český jazykový model (hexagram), nějaké tokenizační a technické úpravy (jazyky csNm a enNa2)). Oba využívají Ondrovy '' | ||
- | | **Pokus** | **Dev WMT08** | **Test WMT09** | **Test WMT10** | **Poznámka** | **Datum** | | + | 22.1.2012 '' |
- | | obo-base1 (encs) | 0.1084 | 0.0990 | | | 3.3.2010 | + | |
- | | obo-base3 (encs) | 0.1064 | 0.0990 | | Na rozdíl | + | |
- | | obo-base3 (encs) | 0.1103 | 0.1012 | | Opravný pokus, tentokrát | + | |
- | | obo-max(-final) (encs) | 0.1344 | 0.1300 | 0.1357 (13.4/12.6) | Ondrův maximální paralelní korpus a třígramový jazykový model. | 7.3.2010 | | + | |
- | | obo-max3 (encs) | 0.1387 | | 0.1402 | Ondrův maximální paralelní korpus a šestigramový jazykový model. | 8.3.2010 | | + | |
- | Na konci srpna 2010 oživuju pokusy s& | + | Nový výsledek 25.1.2012: '' |
+ | Nový výsledek 25.1.2012: | ||
- | | **Pokus** | **Dev WMT08** | **Test WMT09** | **Test WMT10** | **Poznámka** | **Datum** | | + | Výhledově chci přejmenovat '' |
- | | encs: | + | |
- | | encs: | + | |
- | | encs: | + | |
- | | encs: | + | |
- | | encs: | + | |
- | | encs: | + | |
- | | encs: | + | |
- | | encs: | + | |
- | | encs: | + | |
===== Data ===== | ===== Data ===== | ||
Line 118: | Line 108: | ||
Podle časových značek u korpusů v '' | Podle časových značek u korpusů v '' | ||
- | |||
- | ===== Infrastruktura a zarovnání ===== | ||
- | |||
- | Kromě toho jsem někdy v roce 2011 zkoušel předělat Joshuovy skripty, které pouštěly Gizu, aby mohly obě půlky běžet paralelně. Obávám se, že to zůstalo rozvrtané a nefunkční. | ||
===== Inventura 16.1.2012 ===== | ===== Inventura 16.1.2012 ===== | ||
Line 136: | Line 122: | ||
| en-es | 0.2573 | | | en-es | 0.2573 | | ||
| es-en | 0.2446 | | | es-en | 0.2446 | | ||
- | | en-fr | | | + | | en-fr | 0.2591 |
| fr-en | 0.2243 | | | fr-en | 0.2243 | | ||
Line 142: | Line 128: | ||
'' | '' | ||
+ | |||
+ | První výsledky jsou zatím bez záruky, protože v průběhu Gizy jsem narazil na kvótu. Procesy sice nespadly, ale nejsem si jistý, co prováděly těch několik hodin, kdy nemohly psát na disk. Takže raději pustit ještě jednou (ostatně jeden z nich dokonce nedoběhl). | ||
+ | |||
+ | 24.1.2012 už mám i skoro všechny kontrolní výsledky druhého běhu, ale mezitím jsem zjistil chybu v počítání alignmentu, takže pouštím potřetí (zatím šest pokusů pro češtinu, němčinu a španělštinu, | ||
+ | |||
+ | ^ Jazyky ^ BLEU ^ Kontrolní běh ^ Třetí běh ^ | ||
+ | | en-cs | FAILED | 0.1267 | 0.1246 | | ||
+ | | cs-en | 0.1748 | 0.1748 | 0.1792 | | ||
+ | | en-de | 0.1268 | 0.1268 | 0.1274 | | ||
+ | | de-en | 0.1869 | 0.1869 | 0.1859 | | ||
+ | | en-es | 0.2542 | 0.2542 | | | ||
+ | | es-en | 0.2428 | FAILED | 0.2375 | | ||
+ | | en-fr | 0.2586 | 0.2628 | | | ||
+ | | fr-en | 0.2294 | 0.2294 | | | ||
+ |