Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
user:zeman:dz-parser:vysledky [2008/02/20 11:54] zeman |
user:zeman:dz-parser:vysledky [2008/02/20 13:29] (current) zeman Bulharština, slovinština a konec Atanasova dva roky starého mailu. |
||
|---|---|---|---|
| Line 140: | Line 140: | ||
| + | ===== Atanas Čanev, jaro 2006 až 2008 ===== | ||
| + | Atanas se mi ozval, že zkouší použít DZ Parser na italský TUT (Turin University Treebank) a na pár dalších (BulTreeBank, | ||
| + | Pokusy s TUT mám na nilu jako samostatný projekt ve složce projekty\tut. Na zenu tenhle projekt nemám, tam mám jen projekty/ | ||
| - | ===== Atanas Čanev, jaro 2006 až 2008 ===== | + | ==== 20.3.2006 ==== |
| - | Atanas se mi ozval, že zkouší | + | Tyto výsledky jsem zaznamenal při prvních pokusech s Turínským treebankem. Parser |
| - | Pokusy s TUT mám na nilu jako samostatný projekt ve složce projekty\tut. Na zenu tenhle projekt nemám, tam mám jen projekty/ | + | Parsing **všech** (i trénovacích!) dat parserem natrénovaným |
| + | |||
| + | A 41616 - G 30254 - B 11362 - P 72,7 % | ||
| + | |||
| + | Výsledky na testovacích datech: | ||
| + | |||
| + | A 4059 - G 2862 - B 1197 - P 70,5 % | ||
| + | |||
| + | ==== 19.2.2008 | ||
| Následující příkazy nefungují, protože DZ Parser zatím není možné spustit z jiné složky, než ve které se nachází. Perl nenajde knihovny .pm. | Následující příkazy nefungují, protože DZ Parser zatím není možné spustit z jiné složky, než ve které se nachází. Perl nenajde knihovny .pm. | ||
| Line 176: | Line 187: | ||
| Výpočet skončil v 17:34:01. | Výpočet skončil v 17:34:01. | ||
| Program běžel 00:00:14 hodin.</ | Program běžel 00:00:14 hodin.</ | ||
| + | |||
| + | |||
| + | |||
| ==== 20.2.2008 ==== | ==== 20.2.2008 ==== | ||
| Line 182: | Line 196: | ||
| Nyní se pro změnu shání po souboru rematizatory. Tohle se zřejmě konfigurovat nedá, tak prostě nalinkuju český soubor ze sousední složky. | Nyní se pro změnu shání po souboru rematizatory. Tohle se zřejmě konfigurovat nedá, tak prostě nalinkuju český soubor ze sousední složky. | ||
| + | |||
| + | A 4059 - G 2925 - B 1134 - P < | ||
| + | |||
| + | Nyní je na čase ověřit, jak se současná verze parseru liší od poslední verze uložené v SVN. Přinejmenším úprava pro nalezení knihoven by se tam uložit měla. Ukládám do SVN revizi 5. | ||
| + | |||
| + | Nyní by to chtělo uklidit. Projekt tut zrušit, data přestěhovat mezi data, konfiguraci parseru přestěhovat do projektu parser. | ||
| + | |||
| + | ==== Bulharština ==== | ||
| + | |||
| + | Atanas mi ještě psal o problémech, | ||
| + | |||
| + | Atanas hlásil na bulharštině úspěšnost 63,78 % (CoNLL bez interpunkce, | ||
| + | |||
| + | ==== Slovinština ==== | ||
| + | |||
| + | Atanas hlásil na slovinštině úspěšnost 58,34 % (CoNLL bez interpunkce, | ||
