[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
user:zeman:ukoly:tipy [2007/11/21 16:36]
zeman vytvořeno
user:zeman:ukoly:tipy [2009/11/28 18:36] (current)
zeman Nové tipy.
Line 12: Line 12:
  
 Vyzkoumejte, do jaké míry lze tuto úlohu řešit jazykově nezávisle (telefonní číslo lze často rozpoznat, i když okolní text je třeba čínsky a vy neznáte čínský ekvivalent české zkratky "tel.") Vyzkoumejte, do jaké míry lze tuto úlohu řešit jazykově nezávisle (telefonní číslo lze často rozpoznat, i když okolní text je třeba čínsky a vy neznáte čínský ekvivalent české zkratky "tel.")
 +
 +====== Převod dvojúrovňových pravidel na převodníky pro PC-Kimmo ======
 +
 +Vstup: dvojúrovňové pravidlo s kontextem ve formátu à la Karttunen a Xerox.
 +
 +Výstup: převodník realizující toto pravidlo ve formátu pro PC-Kimmo.
 +
 +====== Částečná syntaktická analýza ======
 +
 +Uzávorkovat jednoduché jmenné fráze (hlavou je podstatné jméno, přídavné jméno nebo zájmeno), předložkové fráze a koordinace. Použít rekurzivně volané regulární výrazy (RTN).
 +
 +K dispozici dostanete ručně označkovaná data, na kterých si budete moci testovat úspěšnost pravidel.
 +
 +====== Kombinace klasifikátorů ======
 +
 +Zkombinovat výstupy různých klasifikátorů, taggerů, parserů apod. Využít hlasování, natrénovat výběrový klasifikátor, např. rozhodovací strom pomocí C4.5.
 +
 +K dispozici dostanete data se vzorovou ruční anotací a výstupními anotacemi od všech zúčastněných klasifikátorů.
 +
 +====== Morfo ======
 +
 +David Kolovratník a Leoš Přikryl reimplementovali morfologický analyzátor Jana Hajiče a nazvali ho Morfo (http://ufal.mff.cuni.cz/morfo/). Je tam i grafický Perlový nástroj pro úpravy slovníku. Nemám zatím v hlavě žádné konkrétní zadání, ale určitě by šlo vymyslet nějakou studentskou práci s tímhle analyzátorem, aby si s ním studenti pohráli. Aplikovat ho na korpus, zjistit pokrytí slov (případně nějak i zjistit, že slovo je sice pokryto slovníkem, ale v úplně jiném významu), získat kompletní obsah slovníku, zkoušet přenést slovník pod PC-Kimmo, až po pokus naplnit slovník úplně jiným jazykem.
 +
 +Taky by stálo za to zjistit, zda lze z Morfa získat rozsekání slova na morfémy (hlavní úkol morfologické analýzy je totiž jiný: ke slovnímu tvaru dodat množinu dvojic lemma-značka.
 +
 +====== Další ======
 +
 +  * Transkripce anglického přepisu hindštiny do hindštiny.
 +  * Grammar checker (na základě výstupu parseru a taggeru).
 +  * Příprava dat pro český Morpho Challenge.
 +

[ Back to the navigation ] [ Back to the content ]