[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:dz-parser:conll [2008/03/27 21:10]
zeman Výsledky dtest původní značky.
user:zeman:dz-parser:conll [2008/03/27 21:51]
zeman Výsledky 2006.
Line 2: Line 2:
  
 Tato stránka původně vznikla jako záznam o tom, jakým způsobem jsem spouštěl parser během soutěže v parsingu CoNLL 2007, abych tyto pokusy dokázal zopakovat. Postupně se mění na stránku o pokusech s [[internal:data-conll|daty CoNLL]] obecně (nejen 2007). Data leží v ''/net/data/conll''. Parser odsud čte, ale nepíše sem. Pro soubory související se syntaktickou analýzou těchto dat mám samostatnou složku ''/net/work/people/zeman/conll-dzparser''. Tato stránka původně vznikla jako záznam o tom, jakým způsobem jsem spouštěl parser během soutěže v parsingu CoNLL 2007, abych tyto pokusy dokázal zopakovat. Postupně se mění na stránku o pokusech s [[internal:data-conll|daty CoNLL]] obecně (nejen 2007). Data leží v ''/net/data/conll''. Parser odsud čte, ale nepíše sem. Pro soubory související se syntaktickou analýzou těchto dat mám samostatnou složku ''/net/work/people/zeman/conll-dzparser''.
- 
  
 ===== Proměnné ===== ===== Proměnné =====
Line 19: Line 18:
 <code>setenv DATA /net/data/conll <code>setenv DATA /net/data/conll
 setenv OUTPUT /net/work/people/zeman/conll-dzparser</code> setenv OUTPUT /net/work/people/zeman/conll-dzparser</code>
- 
-===== Výsledky ===== 
- 
-Následující tabulka ukazuje úspěšnost DZ parseru s výchozím nastavením na průběžných testovacích datech CoNLL 2007, s původními značkami CoNLL (tabulátory, rysy oddělené svislítky): 
- 
-| Jazyk | A | G | B | P | 
-| ar | 5873 | 3757 | 2116 | 64,0 | 
-| ca | 10971 | 7670 | 3301 | 69,9 | 
-| cs | 5760 | 4061 | 1699 | 70,5 | 
-| el | 4874 | 3132 | 1742 | 64,3 | 
-| en | 9529 | 6163 | 3366 | 64,7 | 
-| eu | 4334 | 2477 | 1857 | 57,2 | 
-| hu | 5995 | 4088 | 1907 | 68,2 | 
-| it | 7643 | 5556 | 2087 | 72,7 | 
-| tr | 6210 | 3920 | 2290 | 63,1 | 
-| zh | 2277 | 1506 | 771 | 66,1 | 
  
 ===== Zpracování ===== ===== Zpracování =====
Line 45: Line 28:
 $PARSER/train.pl < $DATA/$ROK/$JAZYK/dtrain.csts > $JAZYK.stat $PARSER/train.pl < $DATA/$ROK/$JAZYK/dtrain.csts > $JAZYK.stat
 ($PARSER/parse.pl -m $JAZYK.stat < $DATA/$ROK/$JAZYK/dtest.csts > $JAZYK.dtest.dz.csts) >& $JAZYK.dtest.log</code> ($PARSER/parse.pl -m $JAZYK.stat < $DATA/$ROK/$JAZYK/dtest.csts > $JAZYK.dtest.dz.csts) >& $JAZYK.dtest.log</code>
 +
 +===== Výsledky =====
 +
 +Následující tabulka ukazuje úspěšnost DZ parseru s výchozím nastavením na průběžných testovacích datech CoNLL 2007, s původními značkami CoNLL (tabulátory, rysy oddělené svislítky):
 +
 +| Jazyk | Rok | A | G | B | P |
 +| ar | 2006 | 3955 | 2555 | 1400 | 64,6 |
 +| ar | 2007 | 5873 | 3757 | 2116 | 64,0 |
 +| bg | 2006 | 4677 | 3178 | 1499 | 67,9 |
 +| ca | 2007 | 10971 | 7670 | 3301 | 69,9 |
 +| cs | 2006 | 5643 | 3822 | 1821 | 67,7 |
 +| cs | 2007 | 5760 | 4061 | 1699 | 70,5 |
 +| da | 2006 | 5470 | 3792 | 1678 | 69,3 |
 +| de | 2006 | 5403 | 3704 | 1699 | 68,6 |
 +| el | 2007 | 4874 | 3132 | 1742 | 64,3 |
 +| en | 2007 | 9529 | 6163 | 3366 | 64,7 |
 +| eu | 2007 | 4334 | 2477 | 1857 | 57,2 |
 +| hu | 2007 | 5995 | 4088 | 1907 | 68,2 |
 +| it | 2007 | 7643 | 5556 | 2087 | 72,7 |
 +| ja | 2006 | 3384 | 2524 | 860 | 74,6 |
 +| nl | 2006 | 6187 | 4579 | 1608 | 74,0 |
 +| pt | 2006 | 6719 | 4941 | 1778 | 73,5 |
 +| sl | 2006 | 4307 | 2765 | 1542 | 64,2 |
 +| sv | 2006 | 7140 | 5075 | 2065 | 71,1 |
 +| tr | 2007 | 6210 | 3920 | 2290 | 63,1 |
 +| zh | 2006 | 1839 | 1269 | 570 | 69,0 |
 +| zh | 2007 | 2277 | 1506 | 771 | 66,1 |
  
 ===== Starší poznámky ===== ===== Starší poznámky =====

[ Back to the navigation ] [ Back to the content ]