Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
anotace-rozsirene-koreference [2009/01/28 20:11] ufal |
anotace-rozsirene-koreference [2009/01/29 11:17] ufal |
* **JP**: Jiří Pergler | * **JP**: Jiří Pergler |
* **AN**: Аня Hедолужко | * **AN**: Аня Hедолужко |
| |
| |
| |
| |
| |
| ^ problém ^ diskuze, řešení ^ techn.pozn. ^ | | ^ problém ^ diskuze, řešení ^ techn.pozn. ^ |
^ RO 28.1. | | Zdá se mi, že by se občas hodila kategorie bridgingu, kterou už kdysi navrhoval Honza, něco jako vztah společného členství v množině. Občas se do textu nějak uvádí B, které je jaksi souřadné s A, např. "trh zlata" - "trh ropy", "poslanec A" - "poslanec B" a když tam není kontrast ani zahrnující pojem, zatím to můžeme označit leda REST. (Musela by se asi určit priorita: pokud je tam něco nadřazeného (u těch poslanců třeba sněmovna), tak SET-SUB nebo PART-WHOLE, a tahle souřadnost jen v případě, že SET/WHOLE chybí, abychom nemuseli připojovat členy podmnožiny k množině a pak ještě mezi sebou.) Ale navrhoval bych to zavést asi jen v případě, že by to neznamenalo pomalejší práci Tredu.| | | ^ RO 28.1. | bridging "souřadnost"? | Zdá se mi, že by se občas hodila kategorie bridgingu, kterou už kdysi navrhoval Honza, něco jako vztah společného členství v množině. Občas se do textu nějak uvádí B, které je jaksi souřadné s A, např. "trh zlata" - "trh ropy", "poslanec A" - "poslanec B" a když tam není kontrast ani zahrnující pojem, zatím to můžeme označit leda REST. (Musela by se asi určit priorita: pokud je tam něco nadřazeného (u těch poslanců třeba sněmovna), tak SET-SUB nebo PART-WHOLE, a tahle souřadnost jen v případě, že SET/WHOLE chybí, abychom nemuseli připojovat členy podmnožiny k množině a pak ještě mezi sebou.) Ale navrhoval bych to zavést asi jen v případě, že by to neznamenalo pomalejší práci Tredu.| | |
^ RO 28.1. | obecný - jednotlivý případ SET-SUB | Ujišťuju se, kdyžtak mě prosím opravte: Vztah obecný případ - jednotlivý případ anotujeme jako bridging SET-SUB. Např. "Nový VW Golf je vybaven motorem o síle..." - "Dostali jsme možnost se novým golfem projet." Je to myslím logické už proto, že první výskyt bychom anotovali jako koreferenci s "Nové golfy", a pak by vztah SET-SUB byl nesporný. Totéž je možno i na úrovni abstraktnějších jmen? Vymýšlím si příklad: "Trestní sazba za zpronevěru je x let." - "Zpronevěra, které se dopustil XY..." Opět SET-SUB? **JP:** Já to tak dělám, i když nevím, jestli je to úplně správně, zrovna jsem se na to chtěl na schůzce zeptat. Připadá mi, že je to přece jen trochu něco jiného než klasický vztah SET-SUB, a tak mě napadlo, jestli by protiklad SET/PART, který se mi poslední dobou často zdá trochu problematický, nešlo využít právě k tomuto rozlišení - např. SET používat pro to obecné-konkrétní, zatímco pro běžné případy vyhradit PART. Ale to je spíš jenom takový nápad, než že bych si za tím nějak stál, navíc nevím, jestli má v této fázi anotace dělat takové změny... **RO:** Účelné změny podle mě rozhodně smysl mají, právě proto, že jsme celkem na začátku a devět desetin korpusu podle nich můžeme ještě udělat. Tenhle návrh mi přijde docela dobrý (taky jen předběžně). | | | ^ RO 28.1. | obecný - jednotlivý případ SET-SUB | Ujišťuju se, kdyžtak mě prosím opravte: Vztah obecný případ - jednotlivý případ anotujeme jako bridging SET-SUB. Např. "Nový VW Golf je vybaven motorem o síle..." - "Dostali jsme možnost se novým golfem projet." Je to myslím logické už proto, že první výskyt bychom anotovali jako koreferenci s "Nové golfy", a pak by vztah SET-SUB byl nesporný. Totéž je možno i na úrovni abstraktnějších jmen? Vymýšlím si příklad: "Trestní sazba za zpronevěru je x let." - "Zpronevěra, které se dopustil XY..." Opět SET-SUB? **JP:** Já to tak dělám, i když nevím, jestli je to úplně správně, zrovna jsem se na to chtěl na schůzce zeptat. Připadá mi, že je to přece jen trochu něco jiného než klasický vztah SET-SUB, a tak mě napadlo, jestli by protiklad SET/PART, který se mi poslední dobou často zdá trochu problematický, nešlo využít právě k tomuto rozlišení - např. SET používat pro to obecné-konkrétní, zatímco pro běžné případy vyhradit PART. Ale to je spíš jenom takový nápad, než že bych si za tím nějak stál, navíc nevím, jestli má v této fázi anotace dělat takové změny... **RO:** Účelné změny podle mě rozhodně smysl mají, právě proto, že jsme celkem na začátku a devět desetin korpusu podle nich můžeme ještě udělat. Tenhle návrh mi přijde docela dobrý (taky jen předběžně). | | |
^ JP, 16.1. | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."// **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | | | ^ JP, 16.1. | uzly s funktorem INTF | Má se anotovat koreference u uzlů s funktorem INTF? Narazil jsem na to ve větě //"Vím, že je **to** ode mne, laika v dotyčném oboru, velmi odvážné, **pouštět se** do polemik s renomovanými experty."// **AN:** neanotovat - správně nebo nesprávně, ale je to označeno atomický uzel, falešný subjekt apod. tedy nemůže mít referenci a koreferovat | | |