Differences
This shows you the differences between two versions of the page.
Next revision
|
Previous revision
Last revision
Both sides next revision
|
prevod-mezi-conll-a-pml [2007/05/16 08:55] zeman vytvořeno |
prevod-mezi-conll-a-pml [2010/10/07 13:32] zeman Kde najít skript? |
====== Převod mezi CoNLL a PML ====== | ====== Převod mezi CoNLL a PML ====== |
| |
| |
===== Převod z CoNLL do PML ===== | ===== Převod z CoNLL do PML ===== |
| |
Pro převod [[Formát CoNLL|formátu CoNLL]] do [[Formát PML|PML]] slouží nástroj [[http://ufal.mff.cuni.cz/jazz/PML/tools/conll2pml|conll2pml]], který napsal Petr Pajas, ale nyní je také součástí [[Parsery|Danových nástrojů pro parsing]]: | Pro převod [[Formát CoNLL|formátu CoNLL]] do [[Formát PML|PML]] slouží nástroj [[http://ufal.mff.cuni.cz/jazz/PML/tools/conll2pml|conll2pml]], který napsal Petr Pajas. Aktuální je vždy součástí rozšíření conll2009 pro [[http://ufal.mff.cuni.cz/~pajas/tred|TrEd]]. Pozor, toto „rozšíření“ nepřidá nový typ ''.conll'' do dialogu pro otevření souboru, jak by si někdo mohl myslet. Získáte s ním však perlový skript, který zavoláte z příkazového řádku, soubory si zkonvertujete do PML a pak už je můžete otevřít v Tredu. |
| |
| V českých Windows XP hledejte rozšíření a skript v cestě ''C:\Documents and Settings\$USERNAME\Data aplikací\.tred.d\extensions\conll2009\bin\conll2pml''. Na Linuxu v úfalí síti máte sice svou složku ''$HOME/.tred.d'', ale rozšíření jsou asi nainstalovaná někde centrálně. |
| |
| Starší verze skriptu je též součástí [[Parsery|Danových nástrojů pro parsing]]. Použití: |
| |
<code>$PARSINGROOT/tools/conll2pml.pl --technical-root --max-sentences 1000000 danish-train.conll</code> | <code>$PARSINGROOT/tools/conll2pml.pl --technical-root --max-sentences 1000000 danish-train.conll</code> |