[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

format-penn [2010/10/20 16:08]
zeman vytvořeno
format-penn [2010/10/20 16:31] (current)
zeman Existující nástroj pro převod do prostého textu.
Line 21: Line 21:
     * Pokud se někde dostalo několik mezer k sobě nebo mezera na začátek či konec řádku, odstranit přebytečné mezery. Případně zformátovat i nějak lépe, aby nebylo každé slovo na samostatném řádku.     * Pokud se někde dostalo několik mezer k sobě nebo mezera na začátek či konec řádku, odstranit přebytečné mezery. Případně zformátovat i nějak lépe, aby nebylo každé slovo na samostatném řádku.
     * Tento postup ovšem neřeší, jak rozpoznat a zahodit případné stopy.     * Tento postup ovšem neřeší, jak rozpoznat a zahodit případné stopy.
 +  * Nástroj, který něco takového (převod do prostého textu) dělá, už existuje a je součástí [[Parsery|Danových nástrojů pro parsing]]:
 +
 +<code>$PARSINGROOT/tools/penn2text.pl < wsj_0001.mrg > wsj_0001.txt</code>
  

[ Back to the navigation ] [ Back to the content ]