[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:zeman:ukoly:tipy [2007/11/21 18:12]
zeman Automatická výroba převodníků pro PC-Kimmo.
user:zeman:ukoly:tipy [2009/11/28 18:36] (current)
zeman Nové tipy.
Line 18: Line 18:
  
 Výstup: převodník realizující toto pravidlo ve formátu pro PC-Kimmo. Výstup: převodník realizující toto pravidlo ve formátu pro PC-Kimmo.
 +
 +====== Částečná syntaktická analýza ======
 +
 +Uzávorkovat jednoduché jmenné fráze (hlavou je podstatné jméno, přídavné jméno nebo zájmeno), předložkové fráze a koordinace. Použít rekurzivně volané regulární výrazy (RTN).
 +
 +K dispozici dostanete ručně označkovaná data, na kterých si budete moci testovat úspěšnost pravidel.
 +
 +====== Kombinace klasifikátorů ======
 +
 +Zkombinovat výstupy různých klasifikátorů, taggerů, parserů apod. Využít hlasování, natrénovat výběrový klasifikátor, např. rozhodovací strom pomocí C4.5.
 +
 +K dispozici dostanete data se vzorovou ruční anotací a výstupními anotacemi od všech zúčastněných klasifikátorů.
 +
 +====== Morfo ======
 +
 +David Kolovratník a Leoš Přikryl reimplementovali morfologický analyzátor Jana Hajiče a nazvali ho Morfo (http://ufal.mff.cuni.cz/morfo/). Je tam i grafický Perlový nástroj pro úpravy slovníku. Nemám zatím v hlavě žádné konkrétní zadání, ale určitě by šlo vymyslet nějakou studentskou práci s tímhle analyzátorem, aby si s ním studenti pohráli. Aplikovat ho na korpus, zjistit pokrytí slov (případně nějak i zjistit, že slovo je sice pokryto slovníkem, ale v úplně jiném významu), získat kompletní obsah slovníku, zkoušet přenést slovník pod PC-Kimmo, až po pokus naplnit slovník úplně jiným jazykem.
 +
 +Taky by stálo za to zjistit, zda lze z Morfa získat rozsekání slova na morfémy (hlavní úkol morfologické analýzy je totiž jiný: ke slovnímu tvaru dodat množinu dvojic lemma-značka.
 +
 +====== Další ======
 +
 +  * Transkripce anglického přepisu hindštiny do hindštiny.
 +  * Grammar checker (na základě výstupu parseru a taggeru).
 +  * Příprava dat pro český Morpho Challenge.
  

[ Back to the navigation ] [ Back to the content ]