[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
user:zeman:dz-parser:conll [2007/03/29 23:13]
zeman vytvořeno
user:zeman:dz-parser:conll [2008/03/26 16:05]
zeman Ještě výstup.
Line 1: Line 1:
-====== Pokusy s DZ Parserem pro CoNLL 2007 ======+====== Pokusy s DZ Parserem pro CoNLL ======
  
-Musíme odeslat i angličtinu!+Tato stránka původně vznikla jako záznam o tom, jakým způsobem jsem spouštěl parser během soutěže v parsingu CoNLL 2007, abych tyto pokusy dokázal zopakovat. Postupně se mění na stránku o pokusech s daty CoNLL obecně (nejen 2007). 
 + 
 +===== Proměnné ===== 
 + 
 +Používám proměnné prostředí, které mám nastavené ve svém ''.cshrc'' takto: 
 + 
 +<code>setenv PARSINGROOT /net/work/people/zeman/parsing 
 +setenv TOOLS $PARSINGROOT/tools 
 +setenv INTERSET ~zeman/projekty/interset 
 +setenv PARSER ~zeman/projekty/parser</code> 
 + 
 +Kromě toho mám ve své ''PATH'' přidáno ''$INTERSET/bin'' a v ''PERLLIB'' a ''PERL5LIB'' mám mj. ''$INTERSET/lib'' a ''$PARSINGROOT/lib''
 + 
 +===== Starší poznámky =====
  
 Postup zpracování jednoho jazyka CoNLL: Postup zpracování jednoho jazyka CoNLL:
Line 18: Line 31:
 $PARSINGROOT/tools/csts2conll.pl < $cesta/${xx}test.dz.a.csts > $cesta/${xx}test.dz.conll</code> $PARSINGROOT/tools/csts2conll.pl < $cesta/${xx}test.dz.a.csts > $cesta/${xx}test.dz.conll</code>
  
 +Takhle to pro čínštinu 2006 nefunguje. Jednak máme dtrain a dtest, jednak při zavolání z cesty s daty (ale s plnou cestou, jak je uvedeno výše) parser stávkuje a nenačte data ze standardního vstupu. Měl by alespoň vypsat cestu ke konfiguračnímu souboru, který používá.
 +
 +<code>setenv parser ~zeman/projekty/parser
 +setenv cesta /net/data/conll/2006/chinese/sinica
 +setenv xx zh
 +$parser/train.pl < $cesta/${xx}dtrain.csts > $cesta/${xx}.stat
 +$parser/parse.pl -m $cesta/${xx}.stat < $cesta/${xx}dtest.csts > $cesta/${xx}dtest.dz.csts
 +~zeman/projekty/interset/bin/csts-zh-conll-cs-pdt.pl < $cesta/${xx}dtrain.csts > $cesta/${xx}dtrain.pdt.csts
 +~zeman/projekty/interset/bin/csts-zh-conll-cs-pdt.pl < $cesta/${xx}dtest.csts > $cesta/${xx}dtest.pdt.csts
 +$parser/train.pl < $cesta/${xx}dtrain.pdt.csts > $cesta/${xx}.pdt.stat
 +$parser/parse.pl -m $cesta/${xx}.pdt.stat < $cesta/${xx}dtest.pdt.csts > $cesta/${xx}dtest.pdt.dz.csts</code>
 +
 +
 +
 +
 +===== Čeština 2006 =====
 +
 +<code>setenv cesta /net/data/conll/2006/czech/pdt
 +setenv xx cs
 +cd $cesta
 +csts_convert_tags.pl -f cs::conll -t cs::pdt < cstrain.csts > cstrain.pdttags.csts
 +csts_convert_tags.pl -f cs::conll -t cs::pdt < cstest.csts > cstest.pdttags.csts
 +$PARSER/train.pl < $cesta/${xx}train.pdttags.csts > $cesta/${xx}.pdttags.stat
 +$PARSER/parse.pl -m $cesta/${xx}.pdttags.stat < $cesta/${xx}test.pdttags.csts > $cesta/${xx}test.pdttags.dz.csts</code>

[ Back to the navigation ] [ Back to the content ]