This is an old revision of the document!
Pokusy s předzpracováním paralelních textů pro TSD 2010
Výsledky
Není-li řečeno jinak, váhy se ladí na newstest2008 a testuje se na newstest2009. Trénuje se zatím na news-commentary, a to jak překladový, tak jazykový model.
Pokus | Dev WMT08 | Test WMT09 | Poznámka | Datum |
encs-josh13 | 0.0878 | 0.0869 | 9.3.2010 | |
encs-articles | 0.0907 | 0.0887 | Z anglické strany vypuštěny určité i neurčité členy. | 16.3.2010 |
encs-subject | 0.0903 | 0.0864 | Před kořenové slovo anglického podmětu vepsán token _SUBJ_ . | 16.3.2010 |