This is an old revision of the document!
Table of Contents
Motivace
Na t-rovině PDT 2.0 proběhlo anotování koreference, a sice … V anotování koreference je potřeba pokračovat i s ohledem na její automatické určování metodami strojového učení.
Určitě chceme mít jakékoli anotace, pro které se rozhodneme (tedy i koreferenční), PRÁVĚ TEĎ. To znamená, že HNED seženeme anotátory (kolik?), HNED je zacvičíme, HNED na ně seženeme peníze, … Tak HNED to nebude, že ano:-))) Zvolme tedy takový způsob anotace, pro který rychle (HNED to nebude ani v tomto případě) seženeme dostatek anotátorů - anotátory nebudeme muset zacvičovat. Vymysleme hru.
Hraní - Brainstorming
- Vstup: Texty v povrchové podobě
- Jaké texty vybrat? Z PDT 2.0 - to by se asi hodilo, protože by sa pak nabízelo srovnání s anotací na tektogramatických stromech.
- Výstup hry: koreferenční řetízky
- gramatická koreference
- textová koreference
- bridging anaphora
- Jak instruovat hráče, aby označovali koreferenční řetízky? Mějme na paměti to, že hráči nesmí být zatíženi jakýmkoli lingvistickým termínem a že by měl při hraní využívat pouze základní vlastnosti tvarosloví a syntaxe.
Anotování koreference
- rozšířená koreference - viz přehled https://wiki.ufal.ms.mff.cuni.cz/user:hladka:data
- ukázky anotovaných souborů
Automatické určování koreference
- Dosavadní experimenty
Dokumenty
- Návrh projektu na GAČR 2009 Automatické určování koreference v textech na základě dat anotovaných netradiční metodou ## automatické určování koreference metodou strojového učení na textech, resp. jejich lineární podobě;