Úlohy z počítačového zpracování přirozeného jazyka
Upozornění: Je možné, že některá zde uvedená zadání jsou již rozebrána, nebo dokonce letos vůbec nebyla v nabídce. Dostupnost zadání zjistíte na stránce s rezervačním formulářem.
- Pavouk (získávání korpusu z webu)
- Minoritní jazyky (získávání korpusu z webu pro málo zastoupené jazyky)
- Hranice slov a vět (tokenizace a segmentace)
- Háčkování (doplňování chybějící diakritiky do textu)
-
- Taggery
- Parsery
- Malt parser (závislostní)
- MST parser (závislostní)
- Collinsův/Bikelův parser (složkový)
- Charniakův/Johnsonův parser (složkový)
- Stanfordský parser (složkový i závislostní)
- Překladače