Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:hladka:playne [2009/06/08 10:47] hladka |
user:hladka:playne [2009/06/26 11:03] (current) mirovsky |
||
---|---|---|---|
Line 4: | Line 4: | ||
===== Anotovani pojmenovanych entit v ceskych textech ===== | ===== Anotovani pojmenovanych entit v ceskych textech ===== | ||
* [[http:// | * [[http:// | ||
+ | |||
===== Automaticka detekce a klasifikace pojmenovanych entit v ceskych textech ===== | ===== Automaticka detekce a klasifikace pojmenovanych entit v ceskych textech ===== | ||
* experimenty Oldricha Kruzy popsane v [[http:// | * experimenty Oldricha Kruzy popsane v [[http:// | ||
- | * experimenty Jany Kravalove | + | * experimenty Jany Kravalove, viz [[http:// |
===== Specification ===== | ===== Specification ===== | ||
- | |||
- | |||
==== Strategy ==== | ==== Strategy ==== | ||
- | * Co se po hracich chce? | + | * Co se po hracich chce? Hledala bych nejaky funny prvek. |
* Co zamykat? | * Co zamykat? | ||
* Jak predkladat dokument? Navic i dokument, ve kterem je uz vyznacena koreference? | * Jak predkladat dokument? Navic i dokument, ve kterem je uz vyznacena koreference? | ||
Line 21: | Line 20: | ||
* Navrhnout kategorie NE. Cerpat z Sevcikova et al. | * Navrhnout kategorie NE. Cerpat z Sevcikova et al. | ||
+ | === JM: Jedna možnost návrhu hry === | ||
+ | * Hráčům by se předkládaly prosté texty bez koreference po větách (naopak, hráčům PlayCoref by se měly zobrazovat pojmenované entity). Nic bych nezamykal, nic bych nezvýrazňoval. | ||
+ | * Hráč by označil pojmenovanou entitu podobně jako se vybírá část textu do bloku, tj. myší (vybírání by poskakovalo po celých slovech). Po označení pojmenované entity by se objevil seznam s možnými typy, ze kterých by hráč vybral ten správný. Až by označil všechny pojmenované entity ve větě, zmáčkl by tlačítko " | ||
+ | * Umím si představit variantu hry na shodu i bez shody; preferoval bych tu shodu | ||
+ | * Hra by trvala určenou dobu nebo by byl dán balík vět, který mají udělat. Pro jednotnou podobu s PlayCoref možná raději určený čas. | ||
+ | * Kategorie viz níže. | ||
+ | * Počítání skóre viz níže. | ||
==== Input texts ==== | ==== Input texts ==== | ||
- | * vety anotovane Sevcikova a spol., popsano v TR. | + | * [[http:// |
- | * Kde jsou? | + | |
- | * Vnitrni format? S jaky vnitrnim formatem budeme pracovat my? | + | |
- | * Tato data se nedaji pouzit v PlayCoref, protoze jsou to vety vytrzene z kontextu. Ale pro testovani hracu se pouzit daji. | + | |
- | * stejne texty jako pro PlayCoref, zatim PDT2.0-Anja. | + | |
- | * vnitrni format | + | |
- | * odkud-kam | + | |
- | * typ | + | |
+ | ==== Kagegorie NE ==== | ||
+ | |||
+ | JM: Vyšel bych z MUC-6 a navrhuji tyto kategorie (bez hierarchie): | ||
+ | * Organizace | ||
+ | * Osoba | ||
+ | * Místo | ||
+ | * Čas | ||
+ | * Číslo (množství) | ||
+ | |||
+ | Je ovšem potřeba projít článek JK a ZŽ a pokusit se namapovat jejich rozdělení na toto - především aby bylo úplné - aby každá jejich NE někam spadla. | ||
==== Scoring ==== | ==== Scoring ==== | ||
- | * Shodny | + | |
+ | JM: Podobně jako u PlayCoref by skóre mělo být počítáno (např. lineární kombinací) z následujících tří položek: | ||
+ | * shoda s automatickou procedurou - aby nám neoznačovali samé prázdné věty nebo vždy první slovo apod. | ||
+ | * shoda s protihráčem (pokud hra nebude založená na shodě - pak by shoda byla samozřejmá) | ||
+ | * rychlost/ | ||
==== Output data ==== | ==== Output data ==== | ||
Line 45: | Line 57: | ||
* Tagger. | * Tagger. | ||
* Procedura detekce a klasifikace NE. | * Procedura detekce a klasifikace NE. | ||
- | |||
- | |||
- | |||
- |