This is an old revision of the document!
Table of Contents
Anotace rozšířené koreference
Anotace rozšířené koreference je projekt anotace jmenné koreference a asociační anafory (bridging anaphora) na PDT.
Dokumenty
Anotátoři
* JK: Jan Křiván
* RO: Radek Ocelák
* JP: Jiří Pergler
* AN: Аня Hедолужко
Diskuze
problém | diskuze, řešení | techn.pozn. | |
---|---|---|---|
schůzka_6.11 | řetězec Petr – to dítě – Petr: opačný vztah hyperonymie. | řetězec Petr – to dítě {coref_text, typ SYN na “Petr”} – Petr {coref_text, typ SYN na “dítě“}. ER zatím nerušíme, ale zahrnujeme tam pouze příklady lexikální hyperonymie (viz příklady v manuálku) a odkazy na slovesa a situace (viz tamtéž). „Petr – dítě“ tak spadá do SYN jako jiné slovní označení. | |
schůzka_6.11 | adjektiva odvozené od pojmenovaných entit, typu německý. Často nejde jednoznačně rozhodnout, jestli se dané „německý“ vztahuje k Německu a má tedy být označeno, nebo třeba k Němcům, nebo vůbec k širší množině (jako německý jazyk apod.) | řešíme, zatím anotovat (jak typy Novak-Novakuv tak i Praha-prazsky) | |
schůzka_6.11 | „leden – červen“. … „ve stejném období loňského roku“. Ve stejném období – jednoznačná koherence, odkaz na „leden – červen“, ale nemáme nástroj pro její označení. | je tu anafora, ale není koreference. Odkazujeme na místo v kalendáři. Docela typický příklad. Zatím nabízím bridging_REST, protože anotujeme hlavně koreferenci a nemůžeme propojit identitou páry, které nejsou koreferenční. |
Data
Train-1
data | # souborů | # vět | # slov | anotátor | odesláno | vráceno | soubory |
---|---|---|---|---|---|---|---|
data_20081016_Anja.zip | 28 | 479 | ??? | AN | 16.10.2008 | - | cmpr9410_001 - lnd94103_106 |
data_20081016_Radek_Ocelak.zip | 31 | 498 | ??? | RO | 16.10.2008 | - | lnd94103_116 - ln94202_75 |
data_20081016_Jan_Krivan.zip | 31 | 496 | ??? | JK | 16.10.2008 | - | ln94202_84 - ln94204_78 |
data_20081016_Jiri_Pergler.zip | 24 | 246 | ??? | JP | 16.10.2008 | - | ln94204_87 - ln94206_29 |
data_20081105_test_shody.zip | 3 | 41 | ??? | AN | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 |
data_20081105_test_shody.zip | 3 | 41 | ??? | RO | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 |
data_20081105_test_shody.zip | 3 | 41 | ??? | JK | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 |
data_20081105_test_shody.zip | 3 | 41 | ??? | JP | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 |
data_20081106_Radek_Ocelak.zip | 816 | ??? | RO | 6.11.2008 | - | ln94206_47, ln94206_65 - ln94209_50 | |
data_20081106_Jan_Krivan.zip | 801 | ??? | JK | 6.11.2008 | - | ln94209_6 - ln95047_051 | |
data_20081106_Jiri_Pergler.zip | 19 | 404 | ??? | JP | 6.11.2008 | - | ln95047_061 - ln95048_102 |