Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:hladka:playne [2009/06/02 08:59] hladka |
user:hladka:playne [2009/06/26 11:03] (current) mirovsky |
||
---|---|---|---|
Line 5: | Line 5: | ||
* [[http:// | * [[http:// | ||
+ | |||
+ | ===== Automaticka detekce a klasifikace pojmenovanych entit v ceskych textech ===== | ||
+ | * experimenty Oldricha Kruzy popsane v [[http:// | ||
+ | * experimenty Jany Kravalove, viz [[http:// | ||
+ | |||
+ | |||
+ | ===== Specification ===== | ||
+ | |||
+ | ==== Strategy ==== | ||
+ | * Co se po hracich chce? Hledala bych nejaky funny prvek. | ||
+ | * Co zamykat? | ||
+ | * Jak predkladat dokument? Navic i dokument, ve kterem je uz vyznacena koreference? | ||
+ | * Shoda? BH: Ja bych zatim zvolila strategii shodnou s PlayCoref, tj. nezakladat hru na shode; informovat hrace poctech NE oznacenych souperem. | ||
+ | * Navrhnout kategorie NE. Cerpat z Sevcikova et al. | ||
+ | |||
+ | === JM: Jedna možnost návrhu hry === | ||
+ | * Hráčům by se předkládaly prosté texty bez koreference po větách (naopak, hráčům PlayCoref by se měly zobrazovat pojmenované entity). Nic bych nezamykal, nic bych nezvýrazňoval. | ||
+ | * Hráč by označil pojmenovanou entitu podobně jako se vybírá část textu do bloku, tj. myší (vybírání by poskakovalo po celých slovech). Po označení pojmenované entity by se objevil seznam s možnými typy, ze kterých by hráč vybral ten správný. Až by označil všechny pojmenované entity ve větě, zmáčkl by tlačítko " | ||
+ | * Umím si představit variantu hry na shodu i bez shody; preferoval bych tu shodu | ||
+ | * Hra by trvala určenou dobu nebo by byl dán balík vět, který mají udělat. Pro jednotnou podobu s PlayCoref možná raději určený čas. | ||
+ | * Kategorie viz níže. | ||
+ | * Počítání skóre viz níže. | ||
+ | |||
+ | ==== Input texts ==== | ||
+ | * [[http:// | ||
+ | |||
+ | ==== Kagegorie NE ==== | ||
+ | |||
+ | JM: Vyšel bych z MUC-6 a navrhuji tyto kategorie (bez hierarchie): | ||
+ | * Organizace | ||
+ | * Osoba | ||
+ | * Místo | ||
+ | * Čas | ||
+ | * Číslo (množství) | ||
+ | |||
+ | Je ovšem potřeba projít článek JK a ZŽ a pokusit se namapovat jejich rozdělení na toto - především aby bylo úplné - aby každá jejich NE někam spadla. | ||
+ | |||
+ | ==== Scoring ==== | ||
+ | |||
+ | JM: Podobně jako u PlayCoref by skóre mělo být počítáno (např. lineární kombinací) z následujících tří položek: | ||
+ | * shoda s automatickou procedurou - aby nám neoznačovali samé prázdné věty nebo vždy první slovo apod. | ||
+ | * shoda s protihráčem (pokud hra nebude založená na shodě - pak by shoda byla samozřejmá) | ||
+ | * rychlost/ | ||
+ | |||
+ | ==== Output data ==== | ||
+ | * Vnitrni format. | ||
+ | |||
+ | ==== Design ==== | ||
+ | |||
+ | ==== Tools needed ==== | ||
+ | * Tagger. | ||
+ | * Procedura detekce a klasifikace NE. |