[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:morpho-challenge-2008 [2008/05/06 09:47]
zeman Převést do CSTS.
user:zeman:morpho-challenge-2008 [2008/05/06 10:30]
zeman Převod dat do formátu CSTS.
Line 18: Line 18:
  
 Můj skript pro automatické rozsekání slov na kmeny a koncovky předpokládá, že vstup je textový korpus ve [[:formát CSTS|formátu CSTS]]. Nejprve tedy musíme trénovací seznamy slov a jejich četností převést do tohoto formátu. Můj skript pro automatické rozsekání slov na kmeny a koncovky předpokládá, že vstup je textový korpus ve [[:formát CSTS|formátu CSTS]]. Nejprve tedy musíme trénovací seznamy slov a jejich četností převést do tohoto formátu.
 +
 +<code>cd $MC
 +foreach l (ar de en fi tr)
 +  mc2csts.pl < data/2008/wordlist.$l.txt -l $l > data/2008/wordlist.$l.csts
 +end</code>
  
 ===== Zbytek této stránky je zatím pouhá kopie z roku 2007 ===== ===== Zbytek této stránky je zatím pouhá kopie z roku 2007 =====

[ Back to the navigation ] [ Back to the content ]