[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Převod mezi CoNLL a CSTS

Převod z CoNLL do CSTS

Pro převod formátu CoNLL do CSTS slouží nástroj conll2csts.pl, který je součástí Danových nástrojů pro parsing:

$PARSINGROOT/tools/conll2csts.pl -l da < danish-train.conll > danish-train.csts

Povinným parametrem je dvoupísmenný kód jazyka podle normy ISO 639-1. Mějte na paměti, že pravověrné CSTS předpokládá kódování ISO 8859-2, ale tento nástroj (úmyslně!) ponechává i na výstupu kódování UTF-8.


[ Back to the navigation ] [ Back to the content ]