[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:tsd2010 [2010/03/18 08:39]
zeman encs-adjective
user:zeman:tsd2010 [2010/03/23 17:34]
zeman Opakované výsledky articles, subject1 a adjective.
Line 12: Line 12:
 | encs-attribute | 0.0785 | 0.0786 | K anglickým přívlastkům připojeno (do jednoho tokenu) ''/Atr''. Cílem bylo odlišit např. "Prague" jako přídavné jméno "pražský" od podstatného jména "Praha". Bohužel se ukazuje, že parser považuje za přívlastek všechno možné, někdy dokonce včetně hlavního slovesa v minulém čase ("agreed"). Proto to asi nefunguje. Možná by bylo lepší zkusit se spolehnout na tagger a jeho názor na to, co je přídavné jméno. | 17.3.2010 | | encs-attribute | 0.0785 | 0.0786 | K anglickým přívlastkům připojeno (do jednoho tokenu) ''/Atr''. Cílem bylo odlišit např. "Prague" jako přídavné jméno "pražský" od podstatného jména "Praha". Bohužel se ukazuje, že parser považuje za přívlastek všechno možné, někdy dokonce včetně hlavního slovesa v minulém čase ("agreed"). Proto to asi nefunguje. Možná by bylo lepší zkusit se spolehnout na tagger a jeho názor na to, co je přídavné jméno. | 17.3.2010 |
 | encs-adjective | 0.0889 | 0.0874 | Místo přívlastků (viz výše) se připojuje ''/JJ'' u přídavných jmen. Zjistil jsem ale, že jako přídavná jména jsou značkována většinou jen slova, která opravdu jako přídavná jména vypadají, nikoli atributivně použitá podstatná jména (jako "Prague"). Takže to nijak signifikantně nepomohlo. Mohli bychom zkusit ještě třetí věc, značkovat atributy, ale pouze ty, které leží před podstatným jménem a samy nemají žádné děti. | 17.3.2010 | | encs-adjective | 0.0889 | 0.0874 | Místo přívlastků (viz výše) se připojuje ''/JJ'' u přídavných jmen. Zjistil jsem ale, že jako přídavná jména jsou značkována většinou jen slova, která opravdu jako přídavná jména vypadají, nikoli atributivně použitá podstatná jména (jako "Prague"). Takže to nijak signifikantně nepomohlo. Mohli bychom zkusit ještě třetí věc, značkovat atributy, ale pouze ty, které leží před podstatným jménem a samy nemají žádné děti. | 17.3.2010 |
 +
 +Protože se ukázalo, že s Joshuou 1.3 zatím neumím docílit stejných výsledků jako s 1.1, pouštím ještě tytéž pokusy s Joshuou 1.1, trénovací data jsou vyčištěná od vět o 100 a více slovech.
 +
 +| **Pokus** | **Dev WMT08** | **Test WMT09** | **Poznámka** | **Datum** |
 +| encs-clean | 0.0913 | 0.0897 | | 21.3.2010 |
 +| encs-articles | 0.0921 | 0.0898 | Z anglické strany vypuštěny určité i neurčité členy. | 23.3.2010 |
 +| encs-subject1 | 0.0891 | 0.0880 | Ke kořenovému slovu anglického podmětu připojeno (do jednoho tokenu) ''/Sb''. | |
 +| encs-adjective | 0.0913 | 0.0893 | K anglickým přídavným jménům se připojuje ''/JJ''. Mohli bychom zkusit ještě třetí věc, značkovat atributy, ale pouze ty, které leží před podstatným jménem a samy nemají žádné děti. | |
 +

[ Back to the navigation ] [ Back to the content ]