[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
user:zeman:ukoly:tipy [2007/11/21 18:16]
zeman Částečná syntaktická analýza.
user:zeman:ukoly:tipy [2009/03/01 21:26]
zeman Morfo.
Line 25: Line 25:
 K dispozici dostanete ručně označkovaná data, na kterých si budete moci testovat úspěšnost pravidel. K dispozici dostanete ručně označkovaná data, na kterých si budete moci testovat úspěšnost pravidel.
  
 +====== Kombinace klasifikátorů ======
 +
 +Zkombinovat výstupy různých klasifikátorů, taggerů, parserů apod. Využít hlasování, natrénovat výběrový klasifikátor, např. rozhodovací strom pomocí C4.5.
 +
 +K dispozici dostanete data se vzorovou ruční anotací a výstupními anotacemi od všech zúčastněných klasifikátorů.
 +
 +====== Morfo ======
 +
 +David Kolovratník a Leoš Přikryl reimplementovali morfologický analyzátor Jana Hajiče a nazvali ho Morfo (http://ufal.mff.cuni.cz/morfo/). Je tam i grafický Perlový nástroj pro úpravy slovníku. Nemám zatím v hlavě žádné konkrétní zadání, ale určitě by šlo vymyslet nějakou studentskou práci s tímhle analyzátorem, aby si s ním studenti pohráli. Aplikovat ho na korpus, zjistit pokrytí slov (případně nějak i zjistit, že slovo je sice pokryto slovníkem, ale v úplně jiném významu), získat kompletní obsah slovníku, zkoušet přenést slovník pod PC-Kimmo, až po pokus naplnit slovník úplně jiným jazykem.
 +
 +Taky by stálo za to zjistit, zda lze z Morfa získat rozsekání slova na morfémy (hlavní úkol morfologické analýzy je totiž jiný: ke slovnímu tvaru dodat množinu dvojic lemma-značka.

[ Back to the navigation ] [ Back to the content ]