Tato stránka vznikla inventurou v říjnu 2009 po téměř roce, kdy jsem s TectoMT nepracoval.
Toto jsou knihovny ve složce libs/other
.
Další neuspořádaný kód ve složce personal/zeman
: morphochallenge.
Původně šlo o pokusy s nejnižší úrovní zpracování, tedy tokenizace, rozpoznání hranic vět, rozpoznání jazyka. Pak jsem se pokusil to použít naostro na texty z hindské Wikipedie. Momentální obsah složky je tomuto cíli dost podřízen. Mimochodem, s tou Wikipedií jsem moc neuspěl, a to ze dvou důvodů:
Poučení: TectoMT se bohužel nedá efektivně použít už od nejnižší úrovně zpracování. Je lepší zařídit si tokenizaci a segmentaci vět na prostém textu a do TectoMT převést teprve výsledek.
Převod formátů:
Ostatní: