Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:dz-parser:icon [2012/12/08 10:37] zeman První výsledky MST parseru. |
user:zeman:dz-parser:icon [2012/12/09 21:54] zeman Přepracované výsledky. |
||
---|---|---|---|
Line 16: | Line 16: | ||
HTB verze 0,51: train 12041 sent, 268093 tok? (words), dev 1233 / 26416 | HTB verze 0,51: train 12041 sent, 268093 tok? (words), dev 1233 / 26416 | ||
+ | |||
+ | **MST parser:** V& | ||
Vyhodnotit samostatně | Vyhodnotit samostatně | ||
Line 23: | Line 25: | ||
===== Výsledky ===== | ===== Výsledky ===== | ||
+ | |||
+ | * Na malých hindských datech (1000 vět) hlásí, že našel 397875 rysů (je to stejné pro projektivní i neprojektivní model). | ||
+ | * Projektivní trénování trvalo 12 minut a model má necelých 6 MB. | ||
+ | * Neprojektivní trénování trvalo 18 minut a velikost modelu je podobná. | ||
+ | * Na velkých hindských datech (všechny věty) hlásí, že našel 2180868 rysů. | ||
+ | * Neprojektivní trénování trvalo 4 hodiny a model má necelých 35 MB. | ||
+ | * Přepracováno: | ||
+ | * Auto: trénování 9 minut, 641112 rysů, model 32 MB. | ||
+ | * Gold: trénování 20 minut, 2334346 rysů, model 131 MB. | ||
mst nonproj o2 full | mst nonproj o2 full | ||
Line 35: | Line 46: | ||
Parser zřejmě použil jako part of speech sloupec CoNLL POS (nikoli CPOS nebo FEAT). | Parser zřejmě použil jako part of speech sloupec CoNLL POS (nikoli CPOS nebo FEAT). | ||
+ | |||
+ | Přepracováno auto | ||
+ | Labeled | ||
+ | Unlabeled attachment score: 22848 / 26416 * 100 = 86.49 % | ||
+ | Label accuracy score: | ||
+ | |||
+ | Přepracováno gold | ||
+ | Labeled | ||
+ | Unlabeled attachment score: 22568 / 26416 * 100 = 85.43 % | ||
+ | Label accuracy score: | ||
====== ICON 2009 NLP Tools Contest ====== | ====== ICON 2009 NLP Tools Contest ====== |