Differences
This shows you the differences between two versions of the page.
Next revision
|
Previous revision
|
prevod-mezi-conll-a-csts [2007/05/16 08:54] zeman vytvořeno |
prevod-mezi-conll-a-csts [2009/11/02 21:44] (current) zeman Převod opačným směrem. |
Povinným parametrem je dvoupísmenný kód jazyka podle normy [[http://cs.wikipedia.org/wiki/Seznam_jazyk%C5%AF|ISO 639-1]]. Mějte na paměti, že pravověrné CSTS předpokládá kódování ISO 8859-2, ale tento nástroj (úmyslně!) ponechává i na výstupu kódování UTF-8. | Povinným parametrem je dvoupísmenný kód jazyka podle normy [[http://cs.wikipedia.org/wiki/Seznam_jazyk%C5%AF|ISO 639-1]]. Mějte na paměti, že pravověrné CSTS předpokládá kódování ISO 8859-2, ale tento nástroj (úmyslně!) ponechává i na výstupu kódování UTF-8. |
| |
| Pozor. Novější verze ''conll2csts.pl'' počítá s případnou konverzí morfologických značek, kvůli čemuž potřebuje další Danovy knihovny, které nejsou součástí parsovacího repozitáře. Buď si ještě nainstalujte [[user:zeman:interset|DZ Interset]], nebo nasměrujte svůj ''PERLLIB'' (resp. ''PERL5LIB'') do ''/home/zeman/projekty/interset/lib''. |
| |
| ===== Převod z CSTS do CoNLL ===== |
| |
| Analogicky existuje i skript pro převod opačným směrem: |
| |
| <code>$PARSINGROOT/tools/csts2conll.pl -y 2006 < soubor.csts > soubor.conll</code> |