[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:dz-parser:conll [2008/03/27 22:49]
zeman Čeština 2006.
user:zeman:dz-parser:conll [2008/03/27 22:58]
zeman Komentář k výsledkům se značkami PDT.
Line 28: Line 28:
 $PARSER/train.pl < $DATA/$ROK/$JAZYK/dtrain.csts > $JAZYK.stat $PARSER/train.pl < $DATA/$ROK/$JAZYK/dtrain.csts > $JAZYK.stat
 ($PARSER/parse.pl -m $JAZYK.stat < $DATA/$ROK/$JAZYK/dtest.csts > $JAZYK.dtest.dz.csts) >& $JAZYK.dtest.log</code> ($PARSER/parse.pl -m $JAZYK.stat < $DATA/$ROK/$JAZYK/dtest.csts > $JAZYK.dtest.dz.csts) >& $JAZYK.dtest.log</code>
 +
  
  
Line 81: Line 82:
 | zh | 2007 | CoNLL | 2277 | 1506 | 771 | 66,1 | | zh | 2007 | CoNLL | 2277 | 1506 | 771 | 66,1 |
 | zh | 2007 | PDT   | 2277 | 1449 | 828 | 63,6 | | zh | 2007 | PDT   | 2277 | 1449 | 828 | 63,6 |
 +
 +Převod značek do sady PDT pomohl všude kromě čínštiny, i když u některých jazyků možná změna nebyla statisticky významná. U čínštiny lze zhoršení snadno vysvětlit. Čínská sada značek se velmi liší od ostatních, do Intersetu se vejde jen nepatrný zlomek informace, kterou značky nesou, takže ztráta informace při převodu značek je mimořádně veliká.
  
 ===== Starší poznámky ===== ===== Starší poznámky =====

[ Back to the navigation ] [ Back to the content ]