Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:zeman:dz-parser:vysledky [2008/02/20 11:54] zeman |
user:zeman:dz-parser:vysledky [2008/02/20 13:29] (current) zeman Bulharština, slovinština a konec Atanasova dva roky starého mailu. |
||
---|---|---|---|
Line 140: | Line 140: | ||
+ | ===== Atanas Čanev, jaro 2006 až 2008 ===== | ||
+ | Atanas se mi ozval, že zkouší použít DZ Parser na italský TUT (Turin University Treebank) a na pár dalších (BulTreeBank, | ||
+ | Pokusy s TUT mám na nilu jako samostatný projekt ve složce projekty\tut. Na zenu tenhle projekt nemám, tam mám jen projekty/ | ||
- | ===== Atanas Čanev, jaro 2006 až 2008 ===== | + | ==== 20.3.2006 ==== |
- | Atanas se mi ozval, že zkouší | + | Tyto výsledky jsem zaznamenal při prvních pokusech s Turínským treebankem. Parser |
- | Pokusy s TUT mám na nilu jako samostatný projekt ve složce projekty\tut. Na zenu tenhle projekt nemám, tam mám jen projekty/ | + | Parsing **všech** (i trénovacích!) dat parserem natrénovaným |
+ | |||
+ | A 41616 - G 30254 - B 11362 - P 72,7 % | ||
+ | |||
+ | Výsledky na testovacích datech: | ||
+ | |||
+ | A 4059 - G 2862 - B 1197 - P 70,5 % | ||
+ | |||
+ | ==== 19.2.2008 | ||
Následující příkazy nefungují, protože DZ Parser zatím není možné spustit z jiné složky, než ve které se nachází. Perl nenajde knihovny .pm. | Následující příkazy nefungují, protože DZ Parser zatím není možné spustit z jiné složky, než ve které se nachází. Perl nenajde knihovny .pm. | ||
Line 176: | Line 187: | ||
Výpočet skončil v 17:34:01. | Výpočet skončil v 17:34:01. | ||
Program běžel 00:00:14 hodin.</ | Program běžel 00:00:14 hodin.</ | ||
+ | |||
+ | |||
+ | |||
==== 20.2.2008 ==== | ==== 20.2.2008 ==== | ||
Line 182: | Line 196: | ||
Nyní se pro změnu shání po souboru rematizatory. Tohle se zřejmě konfigurovat nedá, tak prostě nalinkuju český soubor ze sousední složky. | Nyní se pro změnu shání po souboru rematizatory. Tohle se zřejmě konfigurovat nedá, tak prostě nalinkuju český soubor ze sousední složky. | ||
+ | |||
+ | A 4059 - G 2925 - B 1134 - P < | ||
+ | |||
+ | Nyní je na čase ověřit, jak se současná verze parseru liší od poslední verze uložené v SVN. Přinejmenším úprava pro nalezení knihoven by se tam uložit měla. Ukládám do SVN revizi 5. | ||
+ | |||
+ | Nyní by to chtělo uklidit. Projekt tut zrušit, data přestěhovat mezi data, konfiguraci parseru přestěhovat do projektu parser. | ||
+ | |||
+ | ==== Bulharština ==== | ||
+ | |||
+ | Atanas mi ještě psal o problémech, | ||
+ | |||
+ | Atanas hlásil na bulharštině úspěšnost 63,78 % (CoNLL bez interpunkce, | ||
+ | |||
+ | ==== Slovinština ==== | ||
+ | |||
+ | Atanas hlásil na slovinštině úspěšnost 58,34 % (CoNLL bez interpunkce, | ||