[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
anotace-rozsirene-koreference [2009/01/28 20:06]
ufal
anotace-rozsirene-koreference [2009/01/29 23:31]
ufal
Line 32: Line 32:
   * **JP**: Jiří Pergler    * **JP**: Jiří Pergler 
   * **AN**: Аня Hедолужко   * **AN**: Аня Hедолужко
 +
 +
 +
 +
  
  
Line 74: Line 78:
  
 |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^ |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^
-^ RO 28.1. |  | Zdá se mi, že by se občas hodila kategorie bridgingu, kterou už kdysi  navrhoval Honza, něco jako vztah společného členství v množině. Občas se do textu nějak uvádí B, které je jaksi souřadné s A, např. "trh zlata" - "trh ropy", "poslanec A" - "poslanec B" a když tam není kontrast ani zahrnující pojem, zatím to můžeme označit leda REST. (Musela by se asi určit priorita: pokud je tam něco nadřazeného (u těch poslanců třeba sněmovna), tak SET-SUB nebo PART-WHOLE, a tahle souřadnost jen v případě, že SET/WHOLE chybí, abychom nemuseli připojovat členy podmnožiny k množině a pak ještě mezi sebou.) Ale navrhoval bych to zavést asi jen v případě, že by to neznamenalo pomalejší práci Tredu.| | +^ RO 28.1. | bridging "souřadnost"?  | Zdá se mi, že by se občas hodila kategorie bridgingu, kterou už kdysi  navrhoval Honza, něco jako vztah společného členství v množině. Občas se do textu nějak uvádí B, které je jaksi souřadné s A, např. "trh zlata" - "trh ropy", "poslanec A" - "poslanec B" a když tam není kontrast ani zahrnující pojem, zatím to můžeme označit leda REST. (Musela by se asi určit priorita: pokud je tam něco nadřazeného (u těch poslanců třeba sněmovna), tak SET-SUB nebo PART-WHOLE, a tahle souřadnost jen v případě, že SET/WHOLE chybí, abychom nemuseli připojovat členy podmnožiny k množině a pak ještě mezi sebou.) Ale navrhoval bych to zavést asi jen v případě, že by to neznamenalo pomalejší práci Tredu.| | 
-^ RO 28.1. | obecný - jednotlivý případ SET-SUB | Ujišťuju se, kdyžtak mě prosím opravte: Vztah obecný případ - jednotlivý případ anotujeme jako bridging SET-SUB. Např. "Nový VW Golf je vybaven motorem o síle..." - "Dostali jsme možnost se novým golfem projet." Je to myslím logické už proto, že první výskyt bychom anotovali jako koreferenci s "Nové golfy", a pak by vztah SET-SUB byl nesporný. Totéž je možno i na úrovni abstraktnějších jmen? Vymýšlím si příklad: "Trestní sazba za zpronevěru je x let." - "Zpronevěra, které se dopustil XY..." Opět SET-SUB? **JP:** Já to tak dělám, i když nevím, jestli je to úplně správně, zrovna jsem se na to chtěl na schůzce zeptat. Připadá mi, že je to přece jen trochu něco jiného než klasický vztah SET-SUB, a tak mě napadlo, jestli by protiklad SET/PART, který se mi poslední dobou často zdá trochu problematický, nešlo využít právě k tomuto rozlišení - např. SET používat pro to obecné-konkrétní, zatímco pro běžné případy vyhradit PART. Ale to je spíš jenom takový nápad než že bych si za tím nějak stál, navíc nevím, jestli má v této fázi anotace dělat takové změny... **RO:** Účelné změny podle mě rozhodně smysl mají, právě proto, že jsme celkem na začátku a devět desetin korpusu podle nich můžeme ještě udělat. Tenhle návrh mi přijde docela dobrý (taky jen předběžně).  | |+^ RO 28.1. | obecný - jednotlivý případ SET-SUB | Ujišťuju se, kdyžtak mě prosím opravte: Vztah obecný případ - jednotlivý případ anotujeme jako bridging SET-SUB. Např. "Nový VW Golf je vybaven motorem o síle..." - "Dostali jsme možnost se novým golfem projet." Je to myslím logické už proto, že první výskyt bychom anotovali jako koreferenci s "Nové golfy", a pak by vztah SET-SUB byl nesporný. Totéž je možno i na úrovni abstraktnějších jmen? Vymýšlím si příklad: "Trestní sazba za zpronevěru je x let." - "Zpronevěra, které se dopustil XY..." Opět SET-SUB? **JP:** Já to tak dělám, i když nevím, jestli je to úplně správně, zrovna jsem se na to chtěl na schůzce zeptat. Připadá mi, že je to přece jen trochu něco jiného než klasický vztah SET-SUB, a tak mě napadlo, jestli by protiklad SET/PART, který se mi poslední dobou často zdá trochu problematický, nešlo využít právě k tomuto rozlišení - např. SET používat pro to obecné-konkrétní, zatímco pro běžné případy vyhradit PART. Ale to je spíš jenom takový nápadnež že bych si za tím nějak stál, navíc nevím, jestli má v této fázi anotace dělat takové změny... **RO:** Účelné změny podle mě rozhodně smysl mají, právě proto, že jsme celkem na začátku a devět desetin korpusu podle nich můžeme ještě udělat. Tenhle návrh mi přijde docela dobrý (taky jen předběžně). **AN:** Taky bych typriklady anotovala jako SET-SUB. Co se tyce takoveho rozdeleni SET a PART, nejsem si jista, ze to ten problem zjednodusi. Probereme to na schuzce - sbirejte priklady, pokud se znovu objevi  | |
 ^ JP, 16.1.  | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."//   **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | | ^ JP, 16.1.  | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."//   **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | |
 ^ RO 4.1.  | "za Prahou" - "tu" | Pokud vím, máme anotovat i anaforická adverbia typu "tady", "zde". Narazil jsem na problematický případ: "za Prahou" - "části města" - "tu". "Město" je koreferenční s "Praha", "tu" neznamená "v Praze", nýbrž "za Prahou", ale když to odkážu k "za Prahou", automaticky se to spojí s "město". Řešit segmentovou koreferencí? Anebo je to další příklad toho, že kde je jasná anafora, nedá se vždy mluvit zároveň o jasné koreferenci, a argument pro částečné odlišení těchhle vztahů? **JP:** To je obecný problém, jak anotovat výrazy s předložkou. Kromě místních určení se to často týká ještě určení časových. Tak např. výrazy "před válkou" a "po válce". Oba tyto výrazy jsou reprezentovány uzly s lemmatem "válka", rozdíl mezi nimi je zachycen pouze subfunktorem (before/after). Je tedy otázka, jak anotovat vzájemný vztah. Kdyby se vycházelo z lemmatu toho uzlu, je to koreference, kdyby se brala v úvahu i informace ze subfunktoru, je to bridging contrast. V tom případě by se ale nemohla značit koreference ani mezi uzly "před válkou" a "válka" (např. ve větě, kde by "válka" byla podmětem) a ani mezi uzly "za Prahou" a "město". Další pěkný příklad je dvojice "před začátkem utkání" a "při rozcvičování". Zde je situace obrácená - když se vezme v úvahu i význam předložky, zachycený subfunktorem, je to koreference, nicméně mezi referenty samotných substantiv žádný označitelný vztah není.  **AN:** Krásné příklady!!! Jenom teoreticky se to vyřešit nedá, musíme se jenom dopmluvit, aby to bylo jednotně. Jak jste to anotovali? Nabizí se mi spíše to řešení orientovat se na holá jména bez předložek, aby vždy byla propojená Praha a Praha. Na škodu skutečné koreference.| --> M, EH| ^ RO 4.1.  | "za Prahou" - "tu" | Pokud vím, máme anotovat i anaforická adverbia typu "tady", "zde". Narazil jsem na problematický případ: "za Prahou" - "části města" - "tu". "Město" je koreferenční s "Praha", "tu" neznamená "v Praze", nýbrž "za Prahou", ale když to odkážu k "za Prahou", automaticky se to spojí s "město". Řešit segmentovou koreferencí? Anebo je to další příklad toho, že kde je jasná anafora, nedá se vždy mluvit zároveň o jasné koreferenci, a argument pro částečné odlišení těchhle vztahů? **JP:** To je obecný problém, jak anotovat výrazy s předložkou. Kromě místních určení se to často týká ještě určení časových. Tak např. výrazy "před válkou" a "po válce". Oba tyto výrazy jsou reprezentovány uzly s lemmatem "válka", rozdíl mezi nimi je zachycen pouze subfunktorem (before/after). Je tedy otázka, jak anotovat vzájemný vztah. Kdyby se vycházelo z lemmatu toho uzlu, je to koreference, kdyby se brala v úvahu i informace ze subfunktoru, je to bridging contrast. V tom případě by se ale nemohla značit koreference ani mezi uzly "před válkou" a "válka" (např. ve větě, kde by "válka" byla podmětem) a ani mezi uzly "za Prahou" a "město". Další pěkný příklad je dvojice "před začátkem utkání" a "při rozcvičování". Zde je situace obrácená - když se vezme v úvahu i význam předložky, zachycený subfunktorem, je to koreference, nicméně mezi referenty samotných substantiv žádný označitelný vztah není.  **AN:** Krásné příklady!!! Jenom teoreticky se to vyřešit nedá, musíme se jenom dopmluvit, aby to bylo jednotně. Jak jste to anotovali? Nabizí se mi spíše to řešení orientovat se na holá jména bez předložek, aby vždy byla propojená Praha a Praha. Na škodu skutečné koreference.| --> M, EH|

[ Back to the navigation ] [ Back to the content ]