Table of Contents

Danovy poznámky k práci s TectoMT

TectoMT

Tato stránka vznikla inventurou v říjnu 2009 po téměř roce, kdy jsem s TectoMT nepracoval.

Moje knihovny kromě bloků

Toto jsou knihovny ve složce libs/other.

Moje bloky

Moje aplikace

Další neuspořádaný kód ve složce personal/zeman: morphochallenge.

Tokenize

Původně šlo o pokusy s nejnižší úrovní zpracování, tedy tokenizace, rozpoznání hranic vět, rozpoznání jazyka. Pak jsem se pokusil to použít naostro na texty z hindské Wikipedie. Momentální obsah složky je tomuto cíli dost podřízen. Mimochodem, s tou Wikipedií jsem moc neuspěl, a to ze dvou důvodů:

Poučení: TectoMT se bohužel nedá efektivně použít už od nejnižší úrovně zpracování. Je lepší zařídit si tokenizaci a segmentaci vět na prostém textu a do TectoMT převést teprve výsledek.

Moje nástroje

Převod formátů:

Ostatní:

Moje data v TMT_SHARED