Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:tsd2010 [2010/03/23 08:01] zeman Předcházející pokusy zopakujeme s Joshuou 1.1. |
user:zeman:tsd2010 [2010/06/01 11:31] zeman encs-articles-subject |
||
---|---|---|---|
Line 17: | Line 17: | ||
| **Pokus** | **Dev WMT08** | **Test WMT09** | **Poznámka** | **Datum** | | | **Pokus** | **Dev WMT08** | **Test WMT09** | **Poznámka** | **Datum** | | ||
| encs-clean | 0.0913 | 0.0897 | | 21.3.2010 | | | encs-clean | 0.0913 | 0.0897 | | 21.3.2010 | | ||
- | | encs-articles | | | Z anglické strany vypuštěny určité i neurčité členy. | | | + | | encs-articles | 0.0921 |
- | | encs-subject1 | | | Ke kořenovému slovu anglického podmětu připojeno (do jednoho tokenu) ''/ | + | | encs-subject1 | 0.0891 |
- | | encs-adjective | | | K anglickým přídavným jménům se připojuje ''/ | + | | encs-adjective | 0.0913 |
+ | |||
+ | 4.5.2010 pouštím další pokus '' | ||
+ | |||
+ | 30.5.2010: verbparticle, | ||
+ | |||
+ | Nové pokusy před odesláním konečné verze článku. Joshua verze 1.1, ale čištění od dlouhých vět už probíhá jako u verze 1.3. | ||
+ | |||
+ | | **Pokus** | **Dev WMT08** | **Test WMT09** | **Poznámka** | **Datum** | | ||
+ | | encs | 0.0916 | 0.0891 | | 31.5.2010 | | ||
+ | | encs-articles | 0.0921 | 0.0898 | Z anglické strany vypuštěny určité i neurčité členy. Statisticky nevýznamné zlepšení. | 31.5.2010 | | ||
+ | | encs-subject | 0.0891 | 0.0864 | Ke kořenovému slovu anglického podmětu připojeno (do jednoho tokenu) ''/ | ||
+ | | encs-articles-subject | 0.0859 | 0.0851 | Kombinace transformací '' | ||
+ | | enhi | 0.1116 | 0.1230 | | 31.5.2010 | | ||
+ | | enhi-articles | 0.1141 | 0.1230 | Zatím se členy odstraňují úplně stejně jako u '' | ||
+ | | enhi-reord2008 | 0.1074 | 0.1172 | Stará pravidla pro úpravu slovosledu z roku 2008: sloveso na konec věty a z předložek záložky. Možná se ale nepodařilo pravidla přenést úplně správně, bude to potřeba ještě prozkoumat po částech. | 31.5.2010 | ||