[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
anotace-rozsirene-koreference [2008/11/11 12:13]
mirovsky
anotace-rozsirene-koreference [2012/04/11 15:45]
ufal
Line 1: Line 1:
 ====== Anotace rozšířené koreference ====== ====== Anotace rozšířené koreference ======
 Anotace rozšířené koreference je projekt anotace jmenné koreference a asociační anafory (bridging anaphora) na PDT. Anotace rozšířené koreference je projekt anotace jmenné koreference a asociační anafory (bridging anaphora) na PDT.
 +
 +===== PDT 2.0 =====
 +[[PDT 2.0]] na samostatne strance
 +
 +===== PEDT =====
 +
 +[[PEDT]] na samostatne strance
 +
 +
 +
 +
 +
 +
 +
  
  
Line 9: Line 23:
  
 ===== Dokumenty ===== ===== Dokumenty =====
-  * Manuálek k anotaci rozšířené koreference (aktuální ​verze): [[http://​ufal.mff.cuni.cz/​~nedoluzko/​koref_anot/​projekt_anotace.pdf | PDF]] +  * Manuálek k anotaci rozšířené koreference (stručná ​verze): [[http://​ufal.mff.cuni.cz/​~nedoluzko/​koref_anot/​manual_RK_kratky.pdf| PDF]] 
-  * Otázky - odpovědi - diskuze ​(do 6.11.): [[http://​ufal.mff.cuni.cz/​~nedoluzko/​koref_anot/​otazky_odpovedi_diskuze.docDOC]] +  * Manuálek k anotaci rozšířené koreference ​(podrobná neupravená verze, ​6.12.):​[[http://​ufal.mff.cuni.cz/​~nedoluzko/​koref_anot/​projekt_anotace.pdf PDF]]  
-  * Koreference NP s abstraktním významem: [[http://​ufal.mff.cuni.cz/​~nedoluzko/​koref_anot/​table_abstr.doc | DOC]]+  * Koreference NP s abstraktním významem ​(**verze 6.12.**): [[http://​ufal.mff.cuni.cz/​~nedoluzko/​koref_anot/​table_abstr.doc | DOC]] 
 +   * //​**NEW!**//​ [[Příklady k zatím nezavedené bridging skupině ANOF|Příklady k zatím nezavedené bridging skupině ANAF]] (nekoreferenční anafora - metajazyk, //takový// apod.) 
 +  * Mezianotatorska neshoda [[http://​ufal.mff.cuni.cz/​~nedoluzko/​koref_anot/​neshoda.pdf | PDF]] 
 + 
 +    
 + 
 + 
 + 
  
  
 ===== Anotátoři ===== ===== Anotátoři =====
  
- * **JK**: Jan Křiván +  ​* **RO**: Radek Ocelák  
- * **RO**: Radek Ocelák +  * **JP**: Jiří Pergler  
- * **JP**: Jiří Pergler  +  * **AN**: Аня Hедолужко 
- * **AN**: Аня Hедолужко+  * (dříve také: **JK**: Jan Křivan) 
 + 
  
  
Line 31: Line 55:
  
 ===== Diskuze ===== ===== Diskuze =====
-|              ^ problém ​           ^ diskuze, řešení ​         ^ techn.pozn. ​       ^ + 
-^ schůzka_6.11 ​   | řetězec Petr – to dítě – Petr: opačný vztah hyperonymie. ​         | řetězec Petr – to dítě {coref_text,​ typ SYN na “Petr”} – Petr {coref_text,​ typ SYN na “dítě“}. ER zatím nerušíme, ale zahrnujeme tam pouze příklady lexikální hyperonymie (viz příklady v manuálku) a odkazy na slovesa a situace (viz tamtéž). „Petr – dítě“ tak spadá do SYN jako jiné slovní označení. ​       | | +[[Diskuze]] ​na samostatné stránce.
-^ schůzka_6.11 ​   | adjektiva odvozené od pojmenovaných entit, typu německý. Často nejde jednoznačně rozhodnout, jestli se dané „německý“ vztahuje k Německu a má tedy být označeno, nebo třeba k Němcům, nebo vůbec k širší množině (jako německý jazyk apod.)| řešíme, zatím anotovat (jak typy Novak-Novakuv tak i Praha-prazsky) ​                  | | +
-^ schůzka_6.11 ​   | „leden – červen“. … „ve stejném období loňského roku“. Ve stejném období – jednoznačná koherence, odkaz na „leden – červen“, ale nemáme nástroj pro její označení. ​         | je tu anafora, ale není koreference. Odkazujeme na místo v kalendáři. Docela typický příklad. Zatím nabízím bridging_REST,​ protože anotujeme hlavně koreferenci a nemůžeme propojit identitou páry, které nejsou koreferenční       | |+
  
  
Line 40: Line 62:
 ===== Data ===== ===== Data =====
  
 +[[Přehled o anotovaných datech]] na samostatné stránce.
 +
 +[[(Polo-)automatické kontroly dat]] na samostatné stránce.
 +
 +
 +
 +
 +
 +
 +
 +===== Zajímavé/​problematické řetězce =====
  
 +[[Problemy|Zajímavé/​problematické řetězce]] na samostatné stránce
  
  
Line 46: Line 80:
  
  
 +===== Rozšíření TrEdu =====
  
-==== Train-1 ====+Pro TrEd existuje rozšíření pro anotaci rozšířené textové koreference a bridging anaphory:
  
-^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ +[[Rozsireni Tredu|Rozšíření TrEdu]] ​na samostatné stránce
-| data_20081016_Anja.zip | 28 | 479 | ??? | AN | 16.10.2008 ​| - | cmpr9410_001 - lnd94103_106 | +
-| data_20081016_Radek_Ocelak.zip | 31 | 498 | ??? | RO | 16.10.2008 | - | lnd94103_116 - ln94202_75 | +
-| data_20081016_Jan_Krivan.zip | 31 | 496 | ??? | JK | 16.10.2008 | - | ln94202_84 - ln94204_78 | +
-| data_20081016_Jiri_Pergler.zip | 24 | 246 | ??? | JP | 16.10.2008 | - | ln94204_87 - ln94206_29 | +
-| data_20081105_test_shody.zip | 3 | 41 | ??? | AN | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | +
-| data_20081105_test_shody.zip | 3 | 41 | ??? | RO | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | +
-| data_20081105_test_shody.zip | 3 | 41 | ??? | JK | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | +
-| data_20081105_test_shody.zip | 3 | 41 | ??? | JP | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | +
-| data_20081106_Radek_Ocelak.zip | | 816 | ??? | RO | 6.11.2008 | - | ln94206_47, ln94206_65 - ln94209_50 | +
-| data_20081106_Jan_Krivan.zip | | 801 | ??? | JK | 6.11.2008 | - | ln94209_6 - ln95047_051 | +
-| data_20081106_Jiri_Pergler.zip | 19 | 404 | ??? | JP | 6.11.2008 | - | ln95047_061 - ln95048_102 |+
  
-===== Zajimave/​problematické řetězce ===== 

[ Back to the navigation ] [ Back to the content ]