Vícejazyčné pojmenované entity z Wikipedie
Toto zatím není plnohodnotné zadání zápočtové úlohy, ale jen nápad, který je potřeba dotvořit. V případě zájmu kontaktujte Dana Zemana se svojí představou, jak by váš program měl vypadat.
Cílem je znova implementovat nebo částečně implementovat metodu popsanou v tomto článku:
Alexander E. Richman, Patrick Schone: Mining Wiki Resources for Multilingual Named Entity Recognition. In: Proceedings of the Annual Meeting of the Association for Computational Linguistics (ACL), pp. 1-9, Columbus, Ohio, USA, 2008