Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:dz-parser:conll [2008/03/26 13:30] zeman Trénování se značkami PDT. |
user:zeman:dz-parser:conll [2008/03/26 16:35] zeman Výsledky rozboru češtiny. |
||
---|---|---|---|
Line 42: | Line 42: | ||
$parser/ | $parser/ | ||
$parser/ | $parser/ | ||
+ | |||
+ | |||
+ | |||
Line 51: | Line 54: | ||
csts_convert_tags.pl -f cs::conll -t cs::pdt < cstrain.csts > cstrain.pdttags.csts | csts_convert_tags.pl -f cs::conll -t cs::pdt < cstrain.csts > cstrain.pdttags.csts | ||
csts_convert_tags.pl -f cs::conll -t cs::pdt < cstest.csts > cstest.pdttags.csts | csts_convert_tags.pl -f cs::conll -t cs::pdt < cstest.csts > cstest.pdttags.csts | ||
- | $PARSER/ | + | $PARSER/ |
+ | $PARSER/ | ||
+ | |||
+ | Výsledky (365 vět, které CoNLL dodalo jako testovací): | ||
+ | |||
+ | Parser (i trénování) byl spuštěn s výchozími parametry bez konfiguračního souboru. Neměl tušení, že zpracovává svůj rodný jazyk. Kromě toho, že testovací data jsou jiná (a podstatně menší), než jsem měl přímo při práci s PDT, také chybí přídavné informace u lemmat (protože je CoNLL částečně přesunulo do atributu Sem, jehož hodnotu jsem při převádění značek zpět na PDT zahodil). Parser z nich využíval informace o křestním jménu a příjmení. Na druhou stranu parseru mohlo pomoct, že pracujeme s ručně přiřazenými značkami. |