[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
prevod-mezi-conll-a-csts [2007/05/16 08:54]
zeman vytvořeno
prevod-mezi-conll-a-csts [2009/11/02 21:44] (current)
zeman Převod opačným směrem.
Line 9: Line 9:
 Povinným parametrem je dvoupísmenný kód jazyka podle normy [[http://cs.wikipedia.org/wiki/Seznam_jazyk%C5%AF|ISO 639-1]]. Mějte na paměti, že pravověrné CSTS předpokládá kódování ISO 8859-2, ale tento nástroj (úmyslně!) ponechává i na výstupu kódování UTF-8. Povinným parametrem je dvoupísmenný kód jazyka podle normy [[http://cs.wikipedia.org/wiki/Seznam_jazyk%C5%AF|ISO 639-1]]. Mějte na paměti, že pravověrné CSTS předpokládá kódování ISO 8859-2, ale tento nástroj (úmyslně!) ponechává i na výstupu kódování UTF-8.
  
 +Pozor. Novější verze ''conll2csts.pl'' počítá s případnou konverzí morfologických značek, kvůli čemuž potřebuje další Danovy knihovny, které nejsou součástí parsovacího repozitáře. Buď si ještě nainstalujte [[user:zeman:interset|DZ Interset]], nebo nasměrujte svůj ''PERLLIB'' (resp. ''PERL5LIB'') do ''/home/zeman/projekty/interset/lib''.
 +
 +===== Převod z CSTS do CoNLL =====
 +
 +Analogicky existuje i skript pro převod opačným směrem:
 +
 +<code>$PARSINGROOT/tools/csts2conll.pl -y 2006 < soubor.csts > soubor.conll</code>

[ Back to the navigation ] [ Back to the content ]