Differences

This shows you the differences between two versions of the page.

--- user:zeman:dz-parser:icon [2012/12/08 10:29]
zeman Udělat.
+++ user:zeman:dz-parser:icon [2012/12/09 20:59]
zeman Statistiky o výkonu.
@@ Line 16: / Line 16: @@
 HTB verze 0,51: train 12041 sent, 268093 tok? (words), dev 1233 / 26416
+**MST parser:** V&nbsp;TectoMT share mají verzi 0.4.3b z&nbsp;října 2009 (''$TMT_ROOT/share/installed_tools/parser/mst/0.4.3b''). Já možná mám nebo jsem měl v&nbsp;''~/nastroje/parsery'' totéž, ale soubor README se tváří, že by to měla být verze 0.5.0. Na [[http://sourceforge.net/projects/mstparser/|Sourceforge]] se tváří, že poslední aktualizace byla 23.1.2012 a verze se stále jmenuje 0.5.0. Resp. možná se tak jmenuje až tahle letošní, protože předcházející aktivita byla 6.5.2011, a to byla zveřejněna verze 0.4.3c. (A verze 0.4.3b ve skutečnosti podle Sourceforge pochází už z&nbsp;4.4.2007.)
 Vyhodnotit samostatně
@@ Line 21: / Line 23: @@
   * uvnitř chunku vs. mezi chunky
   * pro jednotlivé s-značky
+===== Výsledky =====
+  * Na malých hindských datech (1000 vět) hlásí, že našel 397875 rysů (je to stejné pro projektivní i neprojektivní model).
+  * Projektivní trénování trvalo 12 minut a model má necelých 6 MB.
+  * Neprojektivní trénování trvalo 18 minut a velikost modelu je podobná.
+  * Na velkých hindských datech (všechny věty) hlásí, že našel 2180868 rysů.
+  * Neprojektivní trénování trvalo 4 hodiny a model má necelých 35 MB.
+mst nonproj o2 full
+  Labeled   attachment score: 15503 / 26416 * 100 = 58.69 %
+  Unlabeled attachment score: 20408 / 26416 * 100 = 77.26 %
+  Label accuracy score:       16637 / 26416 * 100 = 62.98 %
+mst nonproj o2 1000
+  Labeled   attachment score: 15624 / 26416 * 100 = 59.15 %
+  Unlabeled attachment score: 20335 / 26416 * 100 = 76.98 %
+  Label accuracy score:       16741 / 26416 * 100 = 63.37 %
+Parser zřejmě použil jako part of speech sloupec CoNLL POS (nikoli CPOS nebo FEAT).
 ====== ICON 2009 NLP Tools Contest ======

[ Back to the navigation ] [ Back to the content ]

Institute of Formal and Applied Linguistics Wiki

Differences