[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
anotace-rozsirene-koreference [2009/02/22 12:47]
ufal
anotace-rozsirene-koreference [2009/02/22 13:27]
ufal
Line 41: Line 41:
  
 |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^ |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^
-^ RO, 22.2. | město - stát | Podle dosavadních domluv to byl PART-WHOLE, jak teď? Na jednu stranu to není úplně čistá část, na druhou je to pěkně ohraničená skupina případů, takže bych ji navrhoval nechat v PART-WHOLE. | |+^ RO 22.2. | počítače, kopírky - vše | Zájmeno "vše"/"všechno" není v základní pronominální anotaci, ale někdy je koreferenční: "X daroval Y počítače, kopírky apod. Vše v hodnotě 1 milión." Myslím že to můžeme anotovat standardním způsobem. | |  
 +^ RO, 22.2. | město - stát; ulice-město | Podle dosavadních domluv  byl typ město-stát PART-WHOLE, jak teď? Na jednu stranu to není úplně čistá část, na druhou je to pěkně ohraničená skupina případů, takže bych ji navrhoval nechat v PART-WHOLE. A platí, že případ město-ulice/náměstí... neanotujeme nijak?| |
 ^ AN, 19.2. | anotace koreference generickych NP typu "zvyseni mezd"| anotujte maximalne - u zvyseni a u mezd. Snad tak dosahneme vetsi shody a z hlediska duslednosti je to asi nejspravnejsi reseni. Totez v pripade vahani, jestli NP je pojimana v ruznych casovych usecich, ale vyrazne anaforicky a bez kontrastu, treba DPH tehdy a tehdy apod.  | | ^ AN, 19.2. | anotace koreference generickych NP typu "zvyseni mezd"| anotujte maximalne - u zvyseni a u mezd. Snad tak dosahneme vetsi shody a z hlediska duslednosti je to asi nejspravnejsi reseni. Totez v pripade vahani, jestli NP je pojimana v ruznych casovych usecich, ale vyrazne anaforicky a bez kontrastu, treba DPH tehdy a tehdy apod.  | |
 ^ JP, 18.2. | bridging u uzlů s funktorem RSTR  | Napadlo mě, jestli mezi ty funktory, u kterých se neanotuje bridging v případě přímé závislosti (APP, MAT, PAT, AUTH), nezařadit ještě RSTR. Takový vztah se objevuje poměrně často, což je způsobeno tím, že se do koreferenčních řetězců zapojují adjektiva vytvořená od vlastních názvů. V takových případech je pak potřeba anotovat bridging mezi členy dvojic, jako např. "české město", "maďarský prezident" apod. **AN:** Jasne, zaradime. Tim se nam tam dostanou i priklady typu cesky stat, ktere by take nemeli byt anotovany. Predanotace - zakazat RSTR? **JP:** No, jestli to chápu správně a pokud by se to dělalo stejně jako u těch funktorů APP apod., tak by se např. u dvojice "Maďarsko -- maďarský prezident" anotovala koreference mezi "Maďarsko" a "maďarský", jen by se nově neanotoval žádný bridging na "prezidenta" (stejně jako by to bylo u dvojice "Maďarsko -- prezident Maďarska"). A v tom případě není důvod rušit žádnou předanotaci. Akorát je otázka, co v takovém případě dělat s výrazy typu "Česká republika", příp. "ČR"... | --> JM| ^ JP, 18.2. | bridging u uzlů s funktorem RSTR  | Napadlo mě, jestli mezi ty funktory, u kterých se neanotuje bridging v případě přímé závislosti (APP, MAT, PAT, AUTH), nezařadit ještě RSTR. Takový vztah se objevuje poměrně často, což je způsobeno tím, že se do koreferenčních řetězců zapojují adjektiva vytvořená od vlastních názvů. V takových případech je pak potřeba anotovat bridging mezi členy dvojic, jako např. "české město", "maďarský prezident" apod. **AN:** Jasne, zaradime. Tim se nam tam dostanou i priklady typu cesky stat, ktere by take nemeli byt anotovany. Predanotace - zakazat RSTR? **JP:** No, jestli to chápu správně a pokud by se to dělalo stejně jako u těch funktorů APP apod., tak by se např. u dvojice "Maďarsko -- maďarský prezident" anotovala koreference mezi "Maďarsko" a "maďarský", jen by se nově neanotoval žádný bridging na "prezidenta" (stejně jako by to bylo u dvojice "Maďarsko -- prezident Maďarska"). A v tom případě není důvod rušit žádnou předanotaci. Akorát je otázka, co v takovém případě dělat s výrazy typu "Česká republika", příp. "ČR"... | --> JM|
Line 50: Line 51:
 ^ JP, 13.2. | typ "u nás"  | Jak je to s anotací výrazů typu "u nás"? Předpokládal jsem, že se neanotují, protože jde o zájmeno v první osobě, nicméně v manuálu se u typu "tady v Praze" uvádí i příklad "u nás doma"...  **AN:** Pardon, chyba v manualu, nebudeme ty 1/2 osoby dusledne anotovat| | ^ JP, 13.2. | typ "u nás"  | Jak je to s anotací výrazů typu "u nás"? Předpokládal jsem, že se neanotují, protože jde o zájmeno v první osobě, nicméně v manuálu se u typu "tady v Praze" uvádí i příklad "u nás doma"...  **AN:** Pardon, chyba v manualu, nebudeme ty 1/2 osoby dusledne anotovat| |
 ^ JP, 12.2. | typ dnes v 16 hodin  | //"Třídenní koncert nazvaný Trutnov 87 - 94 začíná dnes v 16 hodin v trutnovském letním kině Na bojišti."// Anotuje se nějak vztah mezi //dnes// a //hodin//? Vzhledem k tomu, že v případech typu //u nás doma// se anotuje identická koreference, mi přijde logické označovat v tomto případě vztah SET (a podle dohody by případně šel i PART).  | | ^ JP, 12.2. | typ dnes v 16 hodin  | //"Třídenní koncert nazvaný Trutnov 87 - 94 začíná dnes v 16 hodin v trutnovském letním kině Na bojišti."// Anotuje se nějak vztah mezi //dnes// a //hodin//? Vzhledem k tomu, že v případech typu //u nás doma// se anotuje identická koreference, mi přijde logické označovat v tomto případě vztah SET (a podle dohody by případně šel i PART).  | |
-^ JP, 8.2. | poptávka -- nulový zájem  | //"Sběrné suroviny se chovají podle poptávky. Příčinou nulového zájmu o starý papír..."// Označuje se v tomto případě nějaký vztah mezi //poptávkou// a //nulovým zájmem//? Napadá mě anotovat to jako SET--SUB, tj. chápat //poptávku// jako potenciální množinu, do které by patřily prvky //nízká poptávka//, //vysoký zájem// apod. (V tomto případě jde ještě navíc o to, že ta //poptávka// je myšlená obecně, zatímco v případě //nulového zájmu// jde o poptávku po papíře.) Je to podobné jako ten případ //inflace// -- //tříprocentní inflace//, který jsme ale, pokud vím, zatím nevyřešili.  | |+^ JP, 8.2. | poptávka -- nulový zájem  | //"Sběrné suroviny se chovají podle poptávky. Příčinou nulového zájmu o starý papír..."// Označuje se v tomto případě nějaký vztah mezi //poptávkou// a //nulovým zájmem//? Napadá mě anotovat to jako SET--SUB, tj. chápat //poptávku// jako potenciální množinu, do které by patřily prvky //nízká poptávka//, //vysoký zájem// apod. (V tomto případě jde ještě navíc o to, že ta //poptávka// je myšlená obecně, zatímco v případě //nulového zájmu// jde o poptávku po papíře.) Je to podobné jako ten případ //inflace// -- //tříprocentní inflace//, který jsme ale, pokud vím, zatím nevyřešili. **RO** Pokud něco, tak SUB-SET, ale už je to podle mě na hranici toho, co ještě anotovat. Těžko tu vymyslíme pravidlo, případy se každý trochu liší; bude to asi vždycky na individuálním posouzení.| |
 ^ AN 3.2. | výsledky schůzky  | **1)** SET/PART - viz dole; **2)** Nekoreferencni anafora - viz dole a nahoře seznam; **3)** Pokud uzel má funktor APP, MAT, AUTH nebo PAT, jeho bridging vzth s přímým rodičem neanotujeme. Pokud však má funktor DIR1 nebo jiný, naopak anotujeme, přičemž v rámci té jedné věty (jeden ze stavkujících podníků - podník SET na jeden); **4)** resili moznost anotace anaforickych adjektic typu "tamni", "zdejsi" a rozhodli, ze je anotovat nebudeme; **5)** v typech identicke textove koreference jsme zrusili typy SYN a ER. Co bylo SYN, ted je nula, ER - castecne do bridgingu, do nereferencni anafory; **6)** koreferenci znacime jenom u vybranych adverbii, hlavne //tam, tady, zde, tehdy, tak// - rozepisu to v manualku; **7)** resili a nevyresili velky problem textove koreference na kontejner nebo na zavisly clen (//__Milion stavkujicich__ vysli na ulice - __pocet stavkujicich__ - __stavkujici__ jsou proti tomu, aby//) ... jeste to rozepisu pozdeji; **8)** ministr - vlada (SET) vs. premier - vlada (FUNCT); **9)** pokud je vyber z vice antecedentu, bridging vzdy vede na ten nejblizsi; **10)** typ "před válkou" -- "po válce" se anotuje jako identická koreference.  | | ^ AN 3.2. | výsledky schůzky  | **1)** SET/PART - viz dole; **2)** Nekoreferencni anafora - viz dole a nahoře seznam; **3)** Pokud uzel má funktor APP, MAT, AUTH nebo PAT, jeho bridging vzth s přímým rodičem neanotujeme. Pokud však má funktor DIR1 nebo jiný, naopak anotujeme, přičemž v rámci té jedné věty (jeden ze stavkujících podníků - podník SET na jeden); **4)** resili moznost anotace anaforickych adjektic typu "tamni", "zdejsi" a rozhodli, ze je anotovat nebudeme; **5)** v typech identicke textove koreference jsme zrusili typy SYN a ER. Co bylo SYN, ted je nula, ER - castecne do bridgingu, do nereferencni anafory; **6)** koreferenci znacime jenom u vybranych adverbii, hlavne //tam, tady, zde, tehdy, tak// - rozepisu to v manualku; **7)** resili a nevyresili velky problem textove koreference na kontejner nebo na zavisly clen (//__Milion stavkujicich__ vysli na ulice - __pocet stavkujicich__ - __stavkujici__ jsou proti tomu, aby//) ... jeste to rozepisu pozdeji; **8)** ministr - vlada (SET) vs. premier - vlada (FUNCT); **9)** pokud je vyber z vice antecedentu, bridging vzdy vede na ten nejblizsi; **10)** typ "před válkou" -- "po válce" se anotuje jako identická koreference.  | |
 ^ RO 28.1. | bridging "souřadnost"?  | Zdá se mi, že by se občas hodila kategorie bridgingu, kterou už kdysi  navrhoval Honza, něco jako vztah společného členství v množině. Občas se do textu nějak uvádí B, které je jaksi souřadné s A, např. "trh zlata" - "trh ropy", "poslanec A" - "poslanec B" a když tam není kontrast ani zahrnující pojem, zatím to můžeme označit leda REST. (Musela by se asi určit priorita: pokud je tam něco nadřazeného (u těch poslanců třeba sněmovna), tak SET-SUB nebo PART-WHOLE, a tahle souřadnost jen v případě, že SET/WHOLE chybí, abychom nemuseli připojovat členy podmnožiny k množině a pak ještě mezi sebou.) Ale navrhoval bych to zavést asi jen v případě, že by to neznamenalo pomalejší práci Tredu. **AN:** Spis se bojim, ze to zpomali vasi praci - vyhledavat elementy mnoziny, a pak jeste hledat preference, jestli tam je nadrazeny clen apod. Co myslite?  **JP:** Mně to přijde jako celkem zbytečné, protože ten významový vztah se mi tam nezdá tak těsný, resp. zdá se mi volnější než některé jiné vztahy, které se taky neanotují (např. ten vztah ČR -- vláda). Někdy navíc jdou tyto vztahy označit jako CONTRAST. **RO:** Dobře, já na tom netrvám. Takže aspoň výrazné případy tohohle, pokud tam není kontrast, můžou jít do REST. OK? **AN:** urcite muzou| | ^ RO 28.1. | bridging "souřadnost"?  | Zdá se mi, že by se občas hodila kategorie bridgingu, kterou už kdysi  navrhoval Honza, něco jako vztah společného členství v množině. Občas se do textu nějak uvádí B, které je jaksi souřadné s A, např. "trh zlata" - "trh ropy", "poslanec A" - "poslanec B" a když tam není kontrast ani zahrnující pojem, zatím to můžeme označit leda REST. (Musela by se asi určit priorita: pokud je tam něco nadřazeného (u těch poslanců třeba sněmovna), tak SET-SUB nebo PART-WHOLE, a tahle souřadnost jen v případě, že SET/WHOLE chybí, abychom nemuseli připojovat členy podmnožiny k množině a pak ještě mezi sebou.) Ale navrhoval bych to zavést asi jen v případě, že by to neznamenalo pomalejší práci Tredu. **AN:** Spis se bojim, ze to zpomali vasi praci - vyhledavat elementy mnoziny, a pak jeste hledat preference, jestli tam je nadrazeny clen apod. Co myslite?  **JP:** Mně to přijde jako celkem zbytečné, protože ten významový vztah se mi tam nezdá tak těsný, resp. zdá se mi volnější než některé jiné vztahy, které se taky neanotují (např. ten vztah ČR -- vláda). Někdy navíc jdou tyto vztahy označit jako CONTRAST. **RO:** Dobře, já na tom netrvám. Takže aspoň výrazné případy tohohle, pokud tam není kontrast, můžou jít do REST. OK? **AN:** urcite muzou| |

[ Back to the navigation ] [ Back to the content ]