[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:dz-parser:conll [2008/03/27 20:44]
zeman
user:zeman:dz-parser:conll [2008/03/27 21:10]
zeman Výsledky dtest původní značky.
Line 2: Line 2:
  
 Tato stránka původně vznikla jako záznam o tom, jakým způsobem jsem spouštěl parser během soutěže v parsingu CoNLL 2007, abych tyto pokusy dokázal zopakovat. Postupně se mění na stránku o pokusech s [[internal:data-conll|daty CoNLL]] obecně (nejen 2007). Data leží v ''/net/data/conll''. Parser odsud čte, ale nepíše sem. Pro soubory související se syntaktickou analýzou těchto dat mám samostatnou složku ''/net/work/people/zeman/conll-dzparser''. Tato stránka původně vznikla jako záznam o tom, jakým způsobem jsem spouštěl parser během soutěže v parsingu CoNLL 2007, abych tyto pokusy dokázal zopakovat. Postupně se mění na stránku o pokusech s [[internal:data-conll|daty CoNLL]] obecně (nejen 2007). Data leží v ''/net/data/conll''. Parser odsud čte, ale nepíše sem. Pro soubory související se syntaktickou analýzou těchto dat mám samostatnou složku ''/net/work/people/zeman/conll-dzparser''.
 +
  
 ===== Proměnné ===== ===== Proměnné =====
Line 18: Line 19:
 <code>setenv DATA /net/data/conll <code>setenv DATA /net/data/conll
 setenv OUTPUT /net/work/people/zeman/conll-dzparser</code> setenv OUTPUT /net/work/people/zeman/conll-dzparser</code>
 +
 +===== Výsledky =====
 +
 +Následující tabulka ukazuje úspěšnost DZ parseru s výchozím nastavením na průběžných testovacích datech CoNLL 2007, s původními značkami CoNLL (tabulátory, rysy oddělené svislítky):
 +
 +| Jazyk | A | G | B | P |
 +| ar | 5873 | 3757 | 2116 | 64,0 |
 +| ca | 10971 | 7670 | 3301 | 69,9 |
 +| cs | 5760 | 4061 | 1699 | 70,5 |
 +| el | 4874 | 3132 | 1742 | 64,3 |
 +| en | 9529 | 6163 | 3366 | 64,7 |
 +| eu | 4334 | 2477 | 1857 | 57,2 |
 +| hu | 5995 | 4088 | 1907 | 68,2 |
 +| it | 7643 | 5556 | 2087 | 72,7 |
 +| tr | 6210 | 3920 | 2290 | 63,1 |
 +| zh | 2277 | 1506 | 771 | 66,1 |
  
 ===== Zpracování ===== ===== Zpracování =====

[ Back to the navigation ] [ Back to the content ]