[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Anotace rozšířené koreference

Anotace rozšířené koreference je projekt anotace jmenné koreference a asociační anafory (bridging anaphora) na PDT.

Dokumenty

Anotátoři

* JK: Jan Křiván
* RO: Radek Ocelák
* JP: Jiří Pergler
* AN: Аня Hедолужко

Diskuze

problém diskuze, řešení techn.pozn.
schůzka_6.11 řetězec Petr – to dítě – Petr: opačný vztah hyperonymie. řetězec Petr – to dítě {coref_text, typ SYN na “Petr”} – Petr {coref_text, typ SYN na “dítě“}. ER zatím nerušíme, ale zahrnujeme tam pouze příklady lexikální hyperonymie (viz příklady v manuálku) a odkazy na slovesa a situace (viz tamtéž). „Petr – dítě“ tak spadá do SYN jako jiné slovní označení.
schůzka_6.11 adjektiva odvozené od pojmenovaných entit, typu německý. Často nejde jednoznačně rozhodnout, jestli se dané „německý“ vztahuje k Německu a má tedy být označeno, nebo třeba k Němcům, nebo vůbec k širší množině (jako německý jazyk apod.) řešíme, zatím anotovat (jak typy Novak-Novakuv tak i Praha-prazsky)
schůzka_6.11 „leden – červen“. … „ve stejném období loňského roku“. Ve stejném období – jednoznačná koherence, odkaz na „leden – červen“, ale nemáme nástroj pro její označení. je tu anafora, ale není koreference. Odkazujeme na místo v kalendáři. Docela typický příklad. Zatím nabízím bridging_REST, protože anotujeme hlavně koreferenci a nemůžeme propojit identitou páry, které nejsou koreferenční.

Data

Train-1

data # souborů # vět # slov anotátor odesláno vráceno soubory
data_20081016_Anja.zip 28 479 ??? AN 16.10.2008 - cmpr9410_001 - lnd94103_106
data_20081016_Radek_Ocelak.zip 31 498 ??? RO 16.10.2008 - lnd94103_116 - ln94202_75
data_20081016_Jan_Krivan.zip 31 496 ??? JK 16.10.2008 - ln94202_84 - ln94204_78
data_20081016_Jiri_Pergler.zip 24 246 ??? JP 16.10.2008 - ln94204_87 - ln94206_29
data_20081105_test_shody.zip 3 41 ??? AN 5.11.2008 - ln94206_38, ln94206_56, mf920922_044
data_20081105_test_shody.zip 3 41 ??? RO 5.11.2008 - ln94206_38, ln94206_56, mf920922_044
data_20081105_test_shody.zip 3 41 ??? JK 5.11.2008 - ln94206_38, ln94206_56, mf920922_044
data_20081105_test_shody.zip 3 41 ??? JP 5.11.2008 - ln94206_38, ln94206_56, mf920922_044
data_20081106_Radek_Ocelak.zip 816 ??? RO 6.11.2008 - ln94206_47, ln94206_65 - ln94209_50

Zajimave/problematické řetězce


[ Back to the navigation ] [ Back to the content ]