[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
anotace-rozsirene-koreference [2009/01/27 22:45]
ufal
anotace-rozsirene-koreference [2009/01/28 18:30]
ufal
Line 20: Line 20:
   * Koreference NP s abstraktním významem (**verze 6.12.**): [[http://ufal.mff.cuni.cz/~nedoluzko/koref_anot/table_abstr.doc | DOC]]   * Koreference NP s abstraktním významem (**verze 6.12.**): [[http://ufal.mff.cuni.cz/~nedoluzko/koref_anot/table_abstr.doc | DOC]]
          
 +
  
  
Line 27: Line 28:
 ===== Anotátoři ===== ===== Anotátoři =====
  
-  * **JK**: Jan Křivan+  * **JK**: Jan Křivan
   * **RO**: Radek Ocelák   * **RO**: Radek Ocelák
   * **JP**: Jiří Pergler    * **JP**: Jiří Pergler 
   * **AN**: Аня Hедолужко   * **AN**: Аня Hедолужко
 +
  
  
Line 67: Line 69:
  
 |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^ |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^
 +^ RO 28.1. | obecný - jednotlivý případ SET-SUB | Ujišťuju se, kdyžtak mě prosím opravte: Vztah obecný případ - jednotlivý případ anotujeme jako bridging SET-SUB. Např. "Nový VW Golf je vybaven motorem o síle..." - "Dostali jsme možnost se novým golfem projet." Je to myslím logické už proto, že první výskyt bychom anotovali jako koreferenci s "Nové golfy", a pak by vztah SET-SUB byl nesporný. Totéž je možno i na úrovni abstraktnějších jmen? Vymýšlím si příklad: "Trestní sazba za zpronevěru je x let." - "Zpronevěra, které se dopustil XY..." Opět SET-SUB?| |
 ^ JP, 16.1.  | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."//   **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | | ^ JP, 16.1.  | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."//   **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | |
 ^ RO 4.1.  | "za Prahou" - "tu" | Pokud vím, máme anotovat i anaforická adverbia typu "tady", "zde". Narazil jsem na problematický případ: "za Prahou" - "části města" - "tu". "Město" je koreferenční s "Praha", "tu" neznamená "v Praze", nýbrž "za Prahou", ale když to odkážu k "za Prahou", automaticky se to spojí s "město". Řešit segmentovou koreferencí? Anebo je to další příklad toho, že kde je jasná anafora, nedá se vždy mluvit zároveň o jasné koreferenci, a argument pro částečné odlišení těchhle vztahů? **JP:** To je obecný problém, jak anotovat výrazy s předložkou. Kromě místních určení se to často týká ještě určení časových. Tak např. výrazy "před válkou" a "po válce". Oba tyto výrazy jsou reprezentovány uzly s lemmatem "válka", rozdíl mezi nimi je zachycen pouze subfunktorem (before/after). Je tedy otázka, jak anotovat vzájemný vztah. Kdyby se vycházelo z lemmatu toho uzlu, je to koreference, kdyby se brala v úvahu i informace ze subfunktoru, je to bridging contrast. V tom případě by se ale nemohla značit koreference ani mezi uzly "před válkou" a "válka" (např. ve větě, kde by "válka" byla podmětem) a ani mezi uzly "za Prahou" a "město". Další pěkný příklad je dvojice "před začátkem utkání" a "při rozcvičování". Zde je situace obrácená - když se vezme v úvahu i význam předložky, zachycený subfunktorem, je to koreference, nicméně mezi referenty samotných substantiv žádný označitelný vztah není.  **AN:** Krásné příklady!!! Jenom teoreticky se to vyřešit nedá, musíme se jenom dopmluvit, aby to bylo jednotně. Jak jste to anotovali? Nabizí se mi spíše to řešení orientovat se na holá jména bez předložek, aby vždy byla propojená Praha a Praha. Na škodu skutečné koreference.| --> M, EH| ^ RO 4.1.  | "za Prahou" - "tu" | Pokud vím, máme anotovat i anaforická adverbia typu "tady", "zde". Narazil jsem na problematický případ: "za Prahou" - "části města" - "tu". "Město" je koreferenční s "Praha", "tu" neznamená "v Praze", nýbrž "za Prahou", ale když to odkážu k "za Prahou", automaticky se to spojí s "město". Řešit segmentovou koreferencí? Anebo je to další příklad toho, že kde je jasná anafora, nedá se vždy mluvit zároveň o jasné koreferenci, a argument pro částečné odlišení těchhle vztahů? **JP:** To je obecný problém, jak anotovat výrazy s předložkou. Kromě místních určení se to často týká ještě určení časových. Tak např. výrazy "před válkou" a "po válce". Oba tyto výrazy jsou reprezentovány uzly s lemmatem "válka", rozdíl mezi nimi je zachycen pouze subfunktorem (before/after). Je tedy otázka, jak anotovat vzájemný vztah. Kdyby se vycházelo z lemmatu toho uzlu, je to koreference, kdyby se brala v úvahu i informace ze subfunktoru, je to bridging contrast. V tom případě by se ale nemohla značit koreference ani mezi uzly "před válkou" a "válka" (např. ve větě, kde by "válka" byla podmětem) a ani mezi uzly "za Prahou" a "město". Další pěkný příklad je dvojice "před začátkem utkání" a "při rozcvičování". Zde je situace obrácená - když se vezme v úvahu i význam předložky, zachycený subfunktorem, je to koreference, nicméně mezi referenty samotných substantiv žádný označitelný vztah není.  **AN:** Krásné příklady!!! Jenom teoreticky se to vyřešit nedá, musíme se jenom dopmluvit, aby to bylo jednotně. Jak jste to anotovali? Nabizí se mi spíše to řešení orientovat se na holá jména bez předložek, aby vždy byla propojená Praha a Praha. Na škodu skutečné koreference.| --> M, EH|
Line 139: Line 142:
 | data_20090106_Jiri_Pergler.zip | 39 | 503 | 8997 | JP | 7.1.2009 | 20.1.2009 | ln95046_106 - ln95049_058 | | | data_20090106_Jiri_Pergler.zip | 39 | 503 | 8997 | JP | 7.1.2009 | 20.1.2009 | ln95046_106 - ln95049_058 | |
 | data_20090119_Jiri_Pergler.zip | 40 | 498 | 7910 | JP | 19.1.2009 | 25.1.2009 | ln95049_068 - ln95049_138, mf920922_005 - mf930709_055 | zbytek do tisíce vět | | data_20090119_Jiri_Pergler.zip | 40 | 498 | 7910 | JP | 19.1.2009 | 25.1.2009 | ln95049_068 - ln95049_138, mf920922_005 - mf930709_055 | zbytek do tisíce vět |
 +
  
  
Line 168: Line 172:
  
  
 +**RO:** "Společnosti k tomu účelu zvlášť zřízené mohou provozovat loterie...". "K tomu účelu" je sice koreferenční s "provozovat loterie", ale anotuji jako SEGM, protože "společnosti" taky visí na slovese a koreferencí by tu vzniklo asi nevhodné zacyklení.
  
 ===== Zatím nevyřešené poznámky k bridging rozšíření pro TrEd (náměty na zlepšení) ===== ===== Zatím nevyřešené poznámky k bridging rozšíření pro TrEd (náměty na zlepšení) =====

[ Back to the navigation ] [ Back to the content ]