[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
anotace-rozsirene-koreference [2009/01/26 17:30]
ufal
anotace-rozsirene-koreference [2009/01/27 22:45]
ufal
Line 23: Line 23:
  
  
-===== Anotátoři ===== 
  
- * **JK**: Jan Křivan 
- * **RO**: Radek Ocelák 
- * **JP**: Jiří Pergler  
- * **AN**: Аня Hедолужко 
  
 +
 +===== Anotátoři =====
 +
 +  * **JK**: Jan Křivan
 +  * **RO**: Radek Ocelák
 +  * **JP**: Jiří Pergler 
 +  * **AN**: Аня Hедолужко
  
  
Line 64: Line 66:
  
 ===== Diskuze ===== ===== Diskuze =====
-viz [[zde]]+
 |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^ |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^
 ^ JP, 16.1.  | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."//   **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | | ^ JP, 16.1.  | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."//   **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | |
 ^ RO 4.1.  | "za Prahou" - "tu" | Pokud vím, máme anotovat i anaforická adverbia typu "tady", "zde". Narazil jsem na problematický případ: "za Prahou" - "části města" - "tu". "Město" je koreferenční s "Praha", "tu" neznamená "v Praze", nýbrž "za Prahou", ale když to odkážu k "za Prahou", automaticky se to spojí s "město". Řešit segmentovou koreferencí? Anebo je to další příklad toho, že kde je jasná anafora, nedá se vždy mluvit zároveň o jasné koreferenci, a argument pro částečné odlišení těchhle vztahů? **JP:** To je obecný problém, jak anotovat výrazy s předložkou. Kromě místních určení se to často týká ještě určení časových. Tak např. výrazy "před válkou" a "po válce". Oba tyto výrazy jsou reprezentovány uzly s lemmatem "válka", rozdíl mezi nimi je zachycen pouze subfunktorem (before/after). Je tedy otázka, jak anotovat vzájemný vztah. Kdyby se vycházelo z lemmatu toho uzlu, je to koreference, kdyby se brala v úvahu i informace ze subfunktoru, je to bridging contrast. V tom případě by se ale nemohla značit koreference ani mezi uzly "před válkou" a "válka" (např. ve větě, kde by "válka" byla podmětem) a ani mezi uzly "za Prahou" a "město". Další pěkný příklad je dvojice "před začátkem utkání" a "při rozcvičování". Zde je situace obrácená - když se vezme v úvahu i význam předložky, zachycený subfunktorem, je to koreference, nicméně mezi referenty samotných substantiv žádný označitelný vztah není.  **AN:** Krásné příklady!!! Jenom teoreticky se to vyřešit nedá, musíme se jenom dopmluvit, aby to bylo jednotně. Jak jste to anotovali? Nabizí se mi spíše to řešení orientovat se na holá jména bez předložek, aby vždy byla propojená Praha a Praha. Na škodu skutečné koreference.| --> M, EH| ^ RO 4.1.  | "za Prahou" - "tu" | Pokud vím, máme anotovat i anaforická adverbia typu "tady", "zde". Narazil jsem na problematický případ: "za Prahou" - "části města" - "tu". "Město" je koreferenční s "Praha", "tu" neznamená "v Praze", nýbrž "za Prahou", ale když to odkážu k "za Prahou", automaticky se to spojí s "město". Řešit segmentovou koreferencí? Anebo je to další příklad toho, že kde je jasná anafora, nedá se vždy mluvit zároveň o jasné koreferenci, a argument pro částečné odlišení těchhle vztahů? **JP:** To je obecný problém, jak anotovat výrazy s předložkou. Kromě místních určení se to často týká ještě určení časových. Tak např. výrazy "před válkou" a "po válce". Oba tyto výrazy jsou reprezentovány uzly s lemmatem "válka", rozdíl mezi nimi je zachycen pouze subfunktorem (before/after). Je tedy otázka, jak anotovat vzájemný vztah. Kdyby se vycházelo z lemmatu toho uzlu, je to koreference, kdyby se brala v úvahu i informace ze subfunktoru, je to bridging contrast. V tom případě by se ale nemohla značit koreference ani mezi uzly "před válkou" a "válka" (např. ve větě, kde by "válka" byla podmětem) a ani mezi uzly "za Prahou" a "město". Další pěkný příklad je dvojice "před začátkem utkání" a "při rozcvičování". Zde je situace obrácená - když se vezme v úvahu i význam předložky, zachycený subfunktorem, je to koreference, nicméně mezi referenty samotných substantiv žádný označitelný vztah není.  **AN:** Krásné příklady!!! Jenom teoreticky se to vyřešit nedá, musíme se jenom dopmluvit, aby to bylo jednotně. Jak jste to anotovali? Nabizí se mi spíše to řešení orientovat se na holá jména bez předložek, aby vždy byla propojená Praha a Praha. Na škodu skutečné koreference.| --> M, EH|
-^ JP, 23.12.  | technický problém s gramatickou koreferencí  | Narazil jsem na problém související s propojením textové a gramatické koreference: //"...očekávají návštěvu sparťanského prezidenta Macha s manažerem Nehodou, kteří by měli podat vysvětlení. (...) Musí zasáhnout manažer nebo prezident klubu."// V první větě je výraz "který" koreferentní jak s "Machem", tak s "Nehodou", a protože jde o koreferenci gramatickou, nelze ji nahradit bridgingem. Problém je, že o několik vět dále jsou uzly "manažer" a "prezident", které jsou každý zvlášť koreferentní s "Nehodou" a "Machem", což ale nejde zaznačit, protože koreference se v obou případech automaticky odkazuje na uzel "který", v důsledku čehož je pak "prezident" označen jako koreferentní s "manažerem". Řešil jsem to tak, že jsem vedl od "manažera" a "prezidenta" bridging na "který", což ale není ideální.  **AN:** Jirko, bylo to jenom jednou? Melo by se to spis vyresit technicky. Pokud se to opakuje, meli bychom umet rucne zrusit automaticke propojeni retezcu| --> JM|+^ JP, 23.12.  | technický problém s gramatickou koreferencí  | Narazil jsem na problém související s propojením textové a gramatické koreference: //"...očekávají návštěvu sparťanského prezidenta Macha s manažerem Nehodou, kteří by měli podat vysvětlení. (...) Musí zasáhnout manažer nebo prezident klubu."// V první větě je výraz "který" koreferentní jak s "Machem", tak s "Nehodou", a protože jde o koreferenci gramatickou, nelze ji nahradit bridgingem. Problém je, že o několik vět dále jsou uzly "manažer" a "prezident", které jsou každý zvlášť koreferentní s "Nehodou" a "Machem", což ale nejde zaznačit, protože koreference se v obou případech automaticky odkazuje na uzel "který", v důsledku čehož je pak "prezident" označen jako koreferentní s "manažerem". Řešil jsem to tak, že jsem vedl od "manažera" a "prezidenta" bridging na "který", což ale není ideální.  **AN:** Jirko, bylo to jenom jednou? Melo by se to spis vyresit technicky. Pokud se to opakuje, meli bychom umet rucne zrusit automaticke propojeni retezcu. **JP:** Zatím jsem se s tím setkal jenom jednou, takže to asi nebude tak častý případ. Vyřešit by to mělo jít jednoduše tím, že by v případě, že od jedoho uzlu vede víc než jedna koreferenční (ne bridgingová) šipka, pro tento uzel neplatilo to automatické propojování. | --> JM|
 ^ JP, 23.12.  | bridging typ FUNCT  | Kde všude se dá použít vztah FUNCT? Zatím je to pokud vím tak, že u typu FUNCT musí být na jedné straně vztahu výraz s rysem [+person]. Nešlo by to rozšířit i na jiné případy? Např. by podle mě bylo vhodné nějak jednotně označovat vztahy typu "Česká republika - vláda", "ČR - poslanecká sněmovna" nebo "Praha - radnice". A vzhledem k tomu, že tyto vztahy jsou významově blízké vztahům anotovaným jako FUNCT (a taky vzheldem k tomu, že tento typ není alespoň v mém případě tolik vytížen), se mi zdá vhodné používat typ FUNCT i pro ně. Pak mám ještě otázku, jestli jde jako FUNCT označovat i vztahy typu "ČR - předseda vlády", které jsou poněkud významově volnější. **AN:** ty vztahy bych neanotovala vubec, myslim, ze jsem to psala i v manualu, je to prilis vagni, prilis zalezi na znalostech sveta a pripomina sirokou semantickou sit| | ^ JP, 23.12.  | bridging typ FUNCT  | Kde všude se dá použít vztah FUNCT? Zatím je to pokud vím tak, že u typu FUNCT musí být na jedné straně vztahu výraz s rysem [+person]. Nešlo by to rozšířit i na jiné případy? Např. by podle mě bylo vhodné nějak jednotně označovat vztahy typu "Česká republika - vláda", "ČR - poslanecká sněmovna" nebo "Praha - radnice". A vzhledem k tomu, že tyto vztahy jsou významově blízké vztahům anotovaným jako FUNCT (a taky vzheldem k tomu, že tento typ není alespoň v mém případě tolik vytížen), se mi zdá vhodné používat typ FUNCT i pro ně. Pak mám ještě otázku, jestli jde jako FUNCT označovat i vztahy typu "ČR - předseda vlády", které jsou poněkud významově volnější. **AN:** ty vztahy bych neanotovala vubec, myslim, ze jsem to psala i v manualu, je to prilis vagni, prilis zalezi na znalostech sveta a pripomina sirokou semantickou sit| |
 ^ JP, 23.12.  | výraz "obdobně"  | Jak řešit tento případ? //"SAPO byl silně zastaralý ještě před svým dokončením; hlavní zájem VÚMS se tou dobou soustředil již na další projekt, elektronkový počítač 1. generace EPOS 1. Ten bohužel dopadl obdobně; byl opuštěn ve stadiu nedokončeného funkčního modelu..."// Výraz "obdobně" odkazuje na předchozí kontext, ale zřejmě to není koreference a ani není úplně jednoznačné, k čemu ho odkázat. Kromě toho by se u něj ještě dala označovat kataforická koreference na celou část věty za středníkem (která je v příslušném souboru vedena jako samostatná věta). Udělal jsem to tak, že jsem tam označil tuto kataforu a zároveň jsem dal bridging vztah typu rest na sloveso "být" v předchozí větě. **AN:** Proc ne? I kdybych ten REST bych asi neanotovala| | ^ JP, 23.12.  | výraz "obdobně"  | Jak řešit tento případ? //"SAPO byl silně zastaralý ještě před svým dokončením; hlavní zájem VÚMS se tou dobou soustředil již na další projekt, elektronkový počítač 1. generace EPOS 1. Ten bohužel dopadl obdobně; byl opuštěn ve stadiu nedokončeného funkčního modelu..."// Výraz "obdobně" odkazuje na předchozí kontext, ale zřejmě to není koreference a ani není úplně jednoznačné, k čemu ho odkázat. Kromě toho by se u něj ještě dala označovat kataforická koreference na celou část věty za středníkem (která je v příslušném souboru vedena jako samostatná věta). Udělal jsem to tak, že jsem tam označil tuto kataforu a zároveň jsem dal bridging vztah typu rest na sloveso "být" v předchozí větě. **AN:** Proc ne? I kdybych ten REST bych asi neanotovala| |
Line 102: Line 104:
  
 ===== Data ===== ===== Data =====
 +
  
 ==== Train-1 ==== ==== Train-1 ====
Line 119: Line 122:
 | data_20081106_nahrada_Radek_Ocelak.zip | 8 | 76 | 1343 | RO | 26.11.2008 | 3.12.2008 | mf920922_054 - mf920922_125 | náhrada za 83 vět (1610 slov) souboru ln94208_11 |  | data_20081106_nahrada_Radek_Ocelak.zip | 8 | 76 | 1343 | RO | 26.11.2008 | 3.12.2008 | mf920922_054 - mf920922_125 | náhrada za 83 vět (1610 slov) souboru ln94208_11 | 
 | soubor ln94208_11 | 1 | 83 | 1610 | AN | - | 1.12.2008 | ln94208_11 | | | soubor ln94208_11 | 1 | 83 | 1610 | AN | - | 1.12.2008 | ln94208_11 | |
 +| data_20090127_test_shody_2.zip | 1 | 40 | 595 | AN | 27.1.2009 | - | ln95048_112 | |
 +| data_20090127_test_shody_2.zip | 1 | 40 | 595 | RO | 27.1.2009 | - | ln95048_112 | |
 +| data_20090127_test_shody_2.zip | 1 | 40 | 595 | JP | 27.1.2009 | - | ln95048_112 | |
  
 ==== Train-1/2 ==== ==== Train-1/2 ====

[ Back to the navigation ] [ Back to the content ]