====== Převod mezi CoNLL a CSTS ====== ===== Převod z CoNLL do CSTS ===== Pro převod [[Formát CoNLL|formátu CoNLL]] do [[Formát CSTS|CSTS]] slouží nástroj ''conll2csts.pl'', který je součástí [[Parsery|Danových nástrojů pro parsing]]: $PARSINGROOT/tools/conll2csts.pl -l da < danish-train.conll > danish-train.csts Povinným parametrem je dvoupísmenný kód jazyka podle normy [[http://cs.wikipedia.org/wiki/Seznam_jazyk%C5%AF|ISO 639-1]]. Mějte na paměti, že pravověrné CSTS předpokládá kódování ISO 8859-2, ale tento nástroj (úmyslně!) ponechává i na výstupu kódování UTF-8. Pozor. Novější verze ''conll2csts.pl'' počítá s případnou konverzí morfologických značek, kvůli čemuž potřebuje další Danovy knihovny, které nejsou součástí parsovacího repozitáře. Buď si ještě nainstalujte [[user:zeman:interset|DZ Interset]], nebo nasměrujte svůj ''PERLLIB'' (resp. ''PERL5LIB'') do ''/home/zeman/projekty/interset/lib''. ===== Převod z CSTS do CoNLL ===== Analogicky existuje i skript pro převod opačným směrem: $PARSINGROOT/tools/csts2conll.pl -y 2006 < soubor.csts > soubor.conll