Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
anotace-rozsirene-koreference [2008/11/11 12:05] mirovsky |
anotace-rozsirene-koreference [2012/04/11 15:57] (current) ufal |
||
---|---|---|---|
Line 2: | Line 2: | ||
Anotace rozšířené koreference je projekt anotace jmenné koreference a asociační anafory (bridging anaphora) na PDT. | Anotace rozšířené koreference je projekt anotace jmenné koreference a asociační anafory (bridging anaphora) na PDT. | ||
+ | ===== PDT 2.0 ===== | ||
+ | [[PDT 2.0]] na samostatne strance | ||
+ | ===== Anotace textove koreference na PEDT ===== | ||
+ | [[PEDT]] na samostatne strance | ||
- | ===== Dokumenty ===== | ||
- | * Manuálek k anotaci rozšířené koreference (aktuální verze): [[http://ufal.mff.cuni.cz/~nedoluzko/koref_anot/projekt_anotace.pdf | PDF]] | ||
- | * Otázky - odpovědi - diskuze (do 6.11.): [[http://ufal.mff.cuni.cz/~nedoluzko/koref_anot/otazky_odpovedi_diskuze.doc| DOC]] | ||
- | * Koreference NP s abstraktním významem: [[http://ufal.mff.cuni.cz/~nedoluzko/koref_anot/table_abstr.doc | DOC]] | ||
- | ===== Anotátoři ===== | ||
- | * **JK**: Jan Křiván | ||
- | * **RO**: Radek Ocelák | ||
- | * **JP**: Jiří Pergler | ||
- | * **AN**: Аня Hедолужко | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | ===== Diskuze ===== | ||
- | | ^ problém ^ diskuze, řešení ^ techn.pozn. ^ | ||
- | ^ schůzka_6.11 | řetězec Petr – to dítě – Petr: opačný vztah hyperonymie. | řetězec Petr – to dítě {coref_text, typ SYN na “Petr”} – Petr {coref_text, typ SYN na “dítě“}. ER zatím nerušíme, ale zahrnujeme tam pouze příklady lexikální hyperonymie (viz příklady v manuálku) a odkazy na slovesa a situace (viz tamtéž). „Petr – dítě“ tak spadá do SYN jako jiné slovní označení. | | | ||
- | ^ schůzka_6.11 | adjektiva odvozené od pojmenovaných entit, typu německý. Často nejde jednoznačně rozhodnout, jestli se dané „německý“ vztahuje k Německu a má tedy být označeno, nebo třeba k Němcům, nebo vůbec k širší množině (jako německý jazyk apod.)| řešíme, zatím anotovat (jak typy Novak-Novakuv tak i Praha-prazsky) | | | ||
- | ^ schůzka_6.11 | „leden – červen“. … „ve stejném období loňského roku“. Ve stejném období – jednoznačná koherence, odkaz na „leden – červen“, ale nemáme nástroj pro její označení. | je tu anafora, ale není koreference. Odkazujeme na místo v kalendáři. Docela typický příklad. Zatím nabízím bridging_REST, protože anotujeme hlavně koreferenci a nemůžeme propojit identitou páry, které nejsou koreferenční. | | | ||
- | |||
- | |||
- | |||
- | ===== Data ===== | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | ==== Train-1 ==== | ||
- | |||
- | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ | ||
- | | data_20081016_Anja.zip | 28 | 479 | ??? | AN | 16.10.2008 | - | cmpr9410_001 - lnd94103_106 | | ||
- | | data_20081016_Radek_Ocelak.zip | 31 | 498 | ??? | RO | 16.10.2008 | - | lnd94103_116 - ln94202_75 | | ||
- | | data_20081016_Jan_Krivan.zip | 31 | 496 | ??? | JK | 16.10.2008 | - | ln94202_84 - ln94204_78 | | ||
- | | data_20081016_Jiri_Pergler.zip | 24 | 246 | ??? | JP | 16.10.2008 | - | ln94204_87 - ln94206_29 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | ??? | AN | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | ??? | RO | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | ??? | JK | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | ??? | JP | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081106_Radek_Ocelak.zip | | 816 | ??? | RO | 6.11.2008 | - | ln94206_47, ln94206_65 - ln94209_50 | | ||
- | |||
- | ===== Zajimave/problematické řetězce ===== |