[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
user:hladka:playne [2009/06/24 12:16]
hladka
user:hladka:playne [2009/06/26 11:03]
mirovsky
Line 4: Line 4:
 ===== Anotovani pojmenovanych entit v ceskych textech ===== ===== Anotovani pojmenovanych entit v ceskych textech =====
   * [[http://ufal.mff.cuni.cz/~zabokrtsky/reports/techrep-ne-2007.pdf| Sevcikova a kol. Technicka zprava]]    * [[http://ufal.mff.cuni.cz/~zabokrtsky/reports/techrep-ne-2007.pdf| Sevcikova a kol. Technicka zprava]] 
 +
  
 ===== Automaticka detekce a klasifikace pojmenovanych entit v ceskych textech ===== ===== Automaticka detekce a klasifikace pojmenovanych entit v ceskych textech =====
   * experimenty Oldricha Kruzy popsane v [[http://ufal.mff.cuni.cz/~zabokrtsky/reports/techrep-ne-2007.pdf| Sevcikova a kol. Technicka zprava]]    * experimenty Oldricha Kruzy popsane v [[http://ufal.mff.cuni.cz/~zabokrtsky/reports/techrep-ne-2007.pdf| Sevcikova a kol. Technicka zprava]] 
-   * experimenty Jany Kravalove - promluvit s ni.+   * experimenty Jany Kravalove, viz [[http://ufal.mff.cuni.cz/~hladka/LGame/ner.pdf|clanek]].
  
  
 ===== Specification ===== ===== Specification =====
- 
- 
- 
  
 ==== Strategy ==== ==== Strategy ====
Line 22: Line 20:
    * Navrhnout kategorie NE. Cerpat z Sevcikova et al.      * Navrhnout kategorie NE. Cerpat z Sevcikova et al.  
  
- +=== JM: Jedna možnost návrhu hry === 
 +   * Hráčům by se předkládaly prosté texty bez koreference po větách (naopak, hráčům PlayCoref by se měly zobrazovat pojmenované entity). Nic bych nezamykal, nic bych nezvýrazňoval. 
 +   * Hráč by označil pojmenovanou entitu podobně jako se vybírá část textu do bloku, tj. myší (vybírání by poskakovalo po celých slovech). Po označení pojmenované entity by se objevil seznam s možnými typy, ze kterých by hráč vybral ten správný. Až by označil všechny pojmenované entity ve větě, zmáčkl by tlačítko "hotovo". (Možnost ke zvážení: případně by předtím nějakým zaškrtávátkem explicitně naznačil, že ve větě není pojmenovaná entita.) 
 +   * Umím si představit variantu hry na shodu i bez shody; preferoval bych tu shodu 
 +   * Hra by trvala určenou dobu nebo by byl dán balík vět, který mají udělat. Pro jednotnou podobu s PlayCoref možná raději určený čas. 
 +   * Kategorie viz níže. 
 +   * Počítání skóre viz níže.
  
 ==== Input texts ==== ==== Input texts ====
   * [[http://ufal.mff.cuni.cz/tectomt/releases/czech_named_entity_corpus_10/index.html|Czech named entity corpus 1.0]]   * [[http://ufal.mff.cuni.cz/tectomt/releases/czech_named_entity_corpus_10/index.html|Czech named entity corpus 1.0]]
  
 +==== Kagegorie NE ====
 +
 +JM: Vyšel bych z MUC-6 a navrhuji tyto kategorie (bez hierarchie):
 +  * Organizace
 +  * Osoba
 +  * Místo
 +  * Čas
 +  * Číslo (množství)
 +
 +Je ovšem potřeba projít článek JK a ZŽ a pokusit se namapovat jejich rozdělení na toto - především aby bylo úplné - aby každá NE někam spadla.
  
 ==== Scoring ==== ==== Scoring ====
 +
 +JM: Podobně jako u PlayCoref by skóre mělo být počítáno (např. lineární kombinací) z následujících tří položek:
 +   * shoda s automatickou procedurou - aby nám neoznačovali samé prázdné věty nebo vždy první slovo apod.
 +   * shoda s protihráčem (pokud hra nebude založená na shodě - pak by shoda byla samozřejmá)
 +   * rychlost/počet zpracovaných vět
  
 ==== Output data ==== ==== Output data ====
Line 39: Line 57:
    * Tagger.    * Tagger.
    * Procedura detekce a klasifikace NE.    * Procedura detekce a klasifikace NE.
- 
- 
- 
- 

[ Back to the navigation ] [ Back to the content ]