Next revision
|
Previous revision
Next revision
Both sides next revision
|
user:zeman:dz-parser [2007/02/28 11:25] zeman |
user:zeman:dz-parser [2007/03/27 16:58] zeman |
| |
A 158962 - G 118894 - B 40068 - P <html><span style='background:yellow'>0.74793975918773</span></html>. Tato úspěšnost je nižší než dříve. Podle záznamů na stránce o českém parsingu jsem už dříve na d-testu PDT 2.0 dosáhl 75 %. SVN revize 3 ale dává stejné výsledky jako teď (P 74,8, G 118894). Uvidíme, co udělá revize 1, která ale není zvyklá pracovat s daty zakódovanými v UTF-8. | A 158962 - G 118894 - B 40068 - P <html><span style='background:yellow'>0.74793975918773</span></html>. Tato úspěšnost je nižší než dříve. Podle záznamů na stránce o českém parsingu jsem už dříve na d-testu PDT 2.0 dosáhl 75 %. SVN revize 3 ale dává stejné výsledky jako teď (P 74,8, G 118894). Uvidíme, co udělá revize 1, která ale není zvyklá pracovat s daty zakódovanými v UTF-8. |
| |
| ==== Čeština CoNLL 2007 ==== |
| |
| Nastavení: stejné jako pro ostatní jazyky, podle výchozího ''parser.ini''. Zvláštní zpracování koordinací je vypnuté. Značky se sice upravují, ale z tvaru CoNLL, v důsledku čehož parser nemá k dispozici informaci o pádu. |
| |
| <code> |
| train.pl < /net/data/CoNLL/2007/czech/pdt/csdtrain.csts |
| parse.pl < /net/data/CoNLL/2007/czech/pdt/csdtest.csts |
| </code> |
| |
| A 5760 - G 3067 - B 2693 - P <html><span style='background:yellow'>0.532465277777778</span></html>. |
| |
| ==== Italština CoNLL 2007 ==== |
| |
| <code>train.pl < /net/data/CoNLL/2007/italian/isst/itdtrain.csts |
| parse.pl < /net/data/CoNLL/2007/italian/isst/itdtrain.csts</code> |
| |
| A 7643 - G 4866 - B 2777 - P <html><span style='background:yellow'>0.63666099699071</span></html>. |
| |
| ==== Katalánština CoNLL 2007 ==== |
| |
| <code>train.pl < /net/data/CoNLL/2007/catalan/cess-cat/cadtrain.csts |
| parse.pl < /net/data/CoNLL/2007/catalan/cess-cat/cadtrain.csts</code> |
| |
| A 10971 - G 6768 - B 4203 - P <html><span style='background:yellow'>0.616899097621001</span></html>. |
| |
| ==== Maďarština CoNLL 2007 ==== |
| |
| <code>train.pl < /net/data/CoNLL/2007/hungarian/szeged/hudtrain.csts |
| parse.pl < /net/data/CoNLL/2007/hungarian/szeged/hudtrain.csts</code> |
| |
| A 5995 - G 3164 - B 2831 - P <html><span style='background:yellow'>0.527773144286906</span></html>. |
| |