[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:dz-parser:icon [2012/12/10 17:42]
zeman Neprojektivní 2. řádu.
user:zeman:dz-parser:icon [2012/12/10 17:44]
zeman Odstraněny zastaralé výsledky.
Line 25: Line 25:
  
 ===== Výsledky ===== ===== Výsledky =====
- 
-  * Na malých hindských datech (1000 vět) hlásí, že našel 397875 rysů (je to stejné pro projektivní i neprojektivní model). 
-  * Projektivní trénování trvalo 12 minut a model má necelých 6 MB. 
-  * Neprojektivní trénování trvalo 18 minut a velikost modelu je podobná. 
-  * Na velkých hindských datech (všechny věty) hlásí, že našel 2180868 rysů. 
-  * Neprojektivní trénování trvalo 4 hodiny a model má necelých 35 MB. 
-  * Přepracováno: MST parser 0.4.3b z /home/zeman/nastroje, 2. řád neprojektivně, 1000 trénovacích vět, CoNLL formát, zatím si nejsem stoprocentně jist, které rysy si z něj bere. 
-    * Auto: trénování 9 minut, 641112 rysů, model 32 MB. 
-    * Gold: trénování 20 minut, 2334346 rysů, model 131 MB. 
- 
-mst nonproj o2 full 
-  Labeled   attachment score: 15503 / 26416 * 100 = 58.69 % 
-  Unlabeled attachment score: 20408 / 26416 * 100 = 77.26 % 
-  Label accuracy score:       16637 / 26416 * 100 = 62.98 % 
- 
-mst nonproj o2 1000 
-  Labeled   attachment score: 15624 / 26416 * 100 = 59.15 % 
-  Unlabeled attachment score: 20335 / 26416 * 100 = 76.98 % 
-  Label accuracy score:       16741 / 26416 * 100 = 63.37 % 
- 
-Parser zřejmě použil jako part of speech sloupec CoNLL POS (nikoli CPOS nebo FEAT). 
- 
-Přepracováno auto 
-  Labeled   attachment score: 17003 / 26416 * 100 = 64.37 % 
-  Unlabeled attachment score: 22848 / 26416 * 100 = 86.49 % 
-  Label accuracy score:       17663 / 26416 * 100 = 66.86 % 
- 
-Přepracováno gold 
-  Labeled   attachment score: 19154 / 26416 * 100 = 72.51 % 
-  Unlabeled attachment score: 22568 / 26416 * 100 = 85.43 % 
-  Label accuracy score:       19832 / 26416 * 100 = 75.08 % 
  
 ==== Různé redukce značek ==== ==== Různé redukce značek ====

[ Back to the navigation ] [ Back to the content ]