[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
user:zeman:ukoly:tipy [2007/11/21 16:36]
zeman vytvořeno
user:zeman:ukoly:tipy [2007/12/12 21:55]
zeman Kombinace klasifikátorů.
Line 12: Line 12:
  
 Vyzkoumejte, do jaké míry lze tuto úlohu řešit jazykově nezávisle (telefonní číslo lze často rozpoznat, i když okolní text je třeba čínsky a vy neznáte čínský ekvivalent české zkratky "tel.") Vyzkoumejte, do jaké míry lze tuto úlohu řešit jazykově nezávisle (telefonní číslo lze často rozpoznat, i když okolní text je třeba čínsky a vy neznáte čínský ekvivalent české zkratky "tel.")
 +
 +====== Převod dvojúrovňových pravidel na převodníky pro PC-Kimmo ======
 +
 +Vstup: dvojúrovňové pravidlo s kontextem ve formátu à la Karttunen a Xerox.
 +
 +Výstup: převodník realizující toto pravidlo ve formátu pro PC-Kimmo.
 +
 +====== Částečná syntaktická analýza ======
 +
 +Uzávorkovat jednoduché jmenné fráze (hlavou je podstatné jméno, přídavné jméno nebo zájmeno), předložkové fráze a koordinace. Použít rekurzivně volané regulární výrazy (RTN).
 +
 +K dispozici dostanete ručně označkovaná data, na kterých si budete moci testovat úspěšnost pravidel.
 +
 +====== Kombinace klasifikátorů ======
 +
 +Zkombinovat výstupy různých klasifikátorů, taggerů, parserů apod. Využít hlasování, natrénovat výběrový klasifikátor, např. rozhodovací strom pomocí C4.5.
 +
 +K dispozici dostanete data se vzorovou ruční anotací a výstupními anotacemi od všech zúčastněných klasifikátorů.
 +

[ Back to the navigation ] [ Back to the content ]