[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
anotace-rozsirene-koreference [2009/02/18 21:39]
ufal
anotace-rozsirene-koreference [2009/02/22 12:47]
ufal
Line 37: Line 37:
   * **JP**: Jiří Pergler    * **JP**: Jiří Pergler 
   * **AN**: Аня Hедолужко   * **AN**: Аня Hедолужко
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
  
 ===== Diskuze ===== ===== Diskuze =====
  
 |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^ |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^
-^ JP, 18.2. | bridging u uzlů s funktorem RSTR  | Napadlo mě, jestli mezi ty funktory, u kterých se neanotuje bridging v případě přímé závislosti (APP, MAT, PAT, AUTH), nezařadit ještě RSTR. Takový vztah se objevuje poměrně často, což je způsobeno tím, že se do koreferenčních řetězců zapojují adjektiva vytvořená od vlastních názvů. V takových případech je pak potřeba anotovat bridging mezi členy dvojic, jako např. "české město", "maďarský prezident" apod. **AN:** Jasne, zaradime. Tim se nam tam dostanou i priklady typu cesky stat, ktere by take nemeli byt anotovany. Predanotace - zakazat RSTR? | --> JM|+^ RO, 22.2. | město - stát | Podle dosavadních domluv to byl PART-WHOLE, jak teď? Na jednu stranu to není úplně čistá část, na druhou je to pěkně ohraničená skupina případů, takže bych ji navrhoval nechat v PART-WHOLE. | | 
 +^ AN, 19.2. | anotace koreference generickych NP typu "zvyseni mezd"| anotujte maximalne - u zvyseni a u mezd. Snad tak dosahneme vetsi shody a z hlediska duslednosti je to asi nejspravnejsi reseni. Totez v pripade vahani, jestli NP je pojimana v ruznych casovych usecich, ale vyrazne anaforicky a bez kontrastu, treba DPH tehdy a tehdy apod.  | | 
 +^ JP, 18.2. | bridging u uzlů s funktorem RSTR  | Napadlo mě, jestli mezi ty funktory, u kterých se neanotuje bridging v případě přímé závislosti (APP, MAT, PAT, AUTH), nezařadit ještě RSTR. Takový vztah se objevuje poměrně často, což je způsobeno tím, že se do koreferenčních řetězců zapojují adjektiva vytvořená od vlastních názvů. V takových případech je pak potřeba anotovat bridging mezi členy dvojic, jako např. "české město", "maďarský prezident" apod. **AN:** Jasne, zaradime. Tim se nam tam dostanou i priklady typu cesky stat, ktere by take nemeli byt anotovany. Predanotace - zakazat RSTR? **JP:** No, jestli to chápu správně a pokud by se to dělalo stejně jako u těch funktorů APP apod., tak by se např. u dvojice "Maďarsko -- maďarský prezident" anotovala koreference mezi "Maďarsko" a "maďarský", jen by se nově neanotoval žádný bridging na "prezidenta" (stejně jako by to bylo u dvojice "Maďarsko -- prezident Maďarska"). A v tom případě není důvod rušit žádnou předanotaci. Akorát je otázka, co v takovém případě dělat s výrazy typu "Česká republika", příp. "ČR"... | --> JM|
 ^ JP, 17.2. | nejasná hranice typů 0/NR  | Pokud se nepletu, tak se v zásadě předpokládá, že v rámci jednoho koreferenčního řetězce se uplatňuje vždy jen jeden typ identické koreference. V praxi to ale ne vždy platí -- zejména tehdy, když se v řetězci střídají různá synonyma. Např. u dvojice //Češi// -- //tento národ// má první výraz generickou referenci, druhý specifickou. Co s takovými případy? **AN:** zachovavat nejednotnost - je zajimava, orientovat se pritom na posledni vyskyt (druhy clen paru) - pokud je specificky, tak nula, jinak - NR | | ^ JP, 17.2. | nejasná hranice typů 0/NR  | Pokud se nepletu, tak se v zásadě předpokládá, že v rámci jednoho koreferenčního řetězce se uplatňuje vždy jen jeden typ identické koreference. V praxi to ale ne vždy platí -- zejména tehdy, když se v řetězci střídají různá synonyma. Např. u dvojice //Češi// -- //tento národ// má první výraz generickou referenci, druhý specifickou. Co s takovými případy? **AN:** zachovavat nejednotnost - je zajimava, orientovat se pritom na posledni vyskyt (druhy clen paru) - pokud je specificky, tak nula, jinak - NR | |
 ^ JP, 16.2. | "ve stejném období tohoto roku" -- typ ANOF?  | Do případného typu ANOF bychom mohli zařadit ten typ "ve stejném období tohoto roku", který jsme kdysi řešili a rozhodli se ho považovat za typ REST. Např. //V prvním pololetí vyrobili provozovatelé vodovodů a kanalizací více než 495 milionů metrů krychlových pitné vody. Je to o 10.19 % méně než ve stejném období roku 1993.// **AN:** No jo, to je takove hranicni. Neni tam uplne zretelne vyjadren anaforicky odkaz. Musim to promyslet.  | | ^ JP, 16.2. | "ve stejném období tohoto roku" -- typ ANOF?  | Do případného typu ANOF bychom mohli zařadit ten typ "ve stejném období tohoto roku", který jsme kdysi řešili a rozhodli se ho považovat za typ REST. Např. //V prvním pololetí vyrobili provozovatelé vodovodů a kanalizací více než 495 milionů metrů krychlových pitné vody. Je to o 10.19 % méně než ve stejném období roku 1993.// **AN:** No jo, to je takove hranicni. Neni tam uplne zretelne vyjadren anaforicky odkaz. Musim to promyslet.  | |
-^ JP, 16.2. | předanotovaná koreference tam, kde by podle významu měl být bridging REST  | //I vyspělé země se stabilizovanou daňovou soustavou, jako je Spolková republika Německo, Belgie, Švédsko, odhadují ve svých zemích podíl stínové ekonomiky na HDP od devíti do třinácti procent, __země Středomoří dokonce na dvacet až třicet procent__, říká Tomáš Dub a dodává: Osobně si myslím, že se podíl šedé ekonomiky na HDP u nás pohybuje tak okolo 15 procent.// Podtržená část je v tektogramatickém stromě reprezentována mimojiné několika rekonstruovanými uzly: uzlem s lemmatem "odhadovat" a příslušným patientem tohoto slovesa. Tento rekonstruovaný patiens původní anotace označuje jako koreferenční s uzlem "podíl". Významově však jde o jiný podíl, protože to je podíl v jiné zemi. Takový případ by se tedy měl jednoznačně anotovat jako REST. Má se tedy původní koreference zrušit a nahradit bridgingem? Podobná situace je např. ve větě //Podle jeho slov je však její podíl na českém HDP zřejmě nižší než v okolních postkomunistických zemích, kde podle jeho osobního odhadu může dosahovat až čtyřiceti procent.//\\ (Mimochodem, ta první věta je zjevně napsaná logicky špatně, takže ve spojení "svých zemích" jsou oba uzly, spojené závislostí s funktorem APP, koreferenční. Ale to jenom tak na okraj.) | |+^ JP, 16.2. | předanotovaná koreference tam, kde by podle významu měl být bridging REST  | //I vyspělé země se stabilizovanou daňovou soustavou, jako je Spolková republika Německo, Belgie, Švédsko, odhadují ve svých zemích podíl stínové ekonomiky na HDP od devíti do třinácti procent, __země Středomoří dokonce na dvacet až třicet procent__, říká Tomáš Dub a dodává: Osobně si myslím, že se podíl šedé ekonomiky na HDP u nás pohybuje tak okolo 15 procent.// Podtržená část je v tektogramatickém stromě reprezentována mimojiné několika rekonstruovanými uzly: uzlem s lemmatem "odhadovat" a příslušným patientem tohoto slovesa. Tento rekonstruovaný patiens původní anotace označuje jako koreferenční s uzlem "podíl". Významově však jde o jiný podíl, protože to je podíl v jiné zemi. Takový případ by se tedy měl jednoznačně anotovat jako REST. Má se tedy původní koreference zrušit a nahradit bridgingem? Podobná situace je např. ve větě //Podle jeho slov je však její podíl na českém HDP zřejmě nižší než v okolních postkomunistických zemích, kde podle jeho osobního odhadu může dosahovat až čtyřiceti procent.//\\ (Mimochodem, ta první věta je zjevně napsaná logicky špatně, takže ve spojení "svých zemích" jsou oba uzly, spojené závislostí s funktorem APP, koreferenční. Ale to jenom tak na okraj.) **AN:** spis bych rekla ze opravit. Snad takovych pripadu nebude moc| |
 ^ JP, 13.2. | "každý z nich"  | Jak se nakonec anotuje "každý z nich"? Kdyby tam bylo "některý z nich", byla by od zájmena koreference na antecedent a mezi "některý" a "z nich" by byl SET. Ale u "každý z nich"? Analogicky by to bylo koreference od zájmena k antecedentu a k tomu ještě koreference mezi "některý" a "z nich"... | | ^ JP, 13.2. | "každý z nich"  | Jak se nakonec anotuje "každý z nich"? Kdyby tam bylo "některý z nich", byla by od zájmena koreference na antecedent a mezi "některý" a "z nich" by byl SET. Ale u "každý z nich"? Analogicky by to bylo koreference od zájmena k antecedentu a k tomu ještě koreference mezi "některý" a "z nich"... | |
-^ JP, 13.2. | typ "u nás"  | Jak je to s anotací výrazů typu "u nás"? Předpokládal jsem, že se neanotují, protože jde o zájmeno v první osobě, nicméně v manuálu se u typu "tady v Praze" uvádí i příklad "u nás doma"...  | |+^ JP, 13.2. | typ "u nás"  | Jak je to s anotací výrazů typu "u nás"? Předpokládal jsem, že se neanotují, protože jde o zájmeno v první osobě, nicméně v manuálu se u typu "tady v Praze" uvádí i příklad "u nás doma"...  **AN:** Pardon, chyba v manualu, nebudeme ty 1/2 osoby dusledne anotovat| |
 ^ JP, 12.2. | typ dnes v 16 hodin  | //"Třídenní koncert nazvaný Trutnov 87 - 94 začíná dnes v 16 hodin v trutnovském letním kině Na bojišti."// Anotuje se nějak vztah mezi //dnes// a //hodin//? Vzhledem k tomu, že v případech typu //u nás doma// se anotuje identická koreference, mi přijde logické označovat v tomto případě vztah SET (a podle dohody by případně šel i PART).  | | ^ JP, 12.2. | typ dnes v 16 hodin  | //"Třídenní koncert nazvaný Trutnov 87 - 94 začíná dnes v 16 hodin v trutnovském letním kině Na bojišti."// Anotuje se nějak vztah mezi //dnes// a //hodin//? Vzhledem k tomu, že v případech typu //u nás doma// se anotuje identická koreference, mi přijde logické označovat v tomto případě vztah SET (a podle dohody by případně šel i PART).  | |
 ^ JP, 8.2. | poptávka -- nulový zájem  | //"Sběrné suroviny se chovají podle poptávky. Příčinou nulového zájmu o starý papír..."// Označuje se v tomto případě nějaký vztah mezi //poptávkou// a //nulovým zájmem//? Napadá mě anotovat to jako SET--SUB, tj. chápat //poptávku// jako potenciální množinu, do které by patřily prvky //nízká poptávka//, //vysoký zájem// apod. (V tomto případě jde ještě navíc o to, že ta //poptávka// je myšlená obecně, zatímco v případě //nulového zájmu// jde o poptávku po papíře.) Je to podobné jako ten případ //inflace// -- //tříprocentní inflace//, který jsme ale, pokud vím, zatím nevyřešili.  | | ^ JP, 8.2. | poptávka -- nulový zájem  | //"Sběrné suroviny se chovají podle poptávky. Příčinou nulového zájmu o starý papír..."// Označuje se v tomto případě nějaký vztah mezi //poptávkou// a //nulovým zájmem//? Napadá mě anotovat to jako SET--SUB, tj. chápat //poptávku// jako potenciální množinu, do které by patřily prvky //nízká poptávka//, //vysoký zájem// apod. (V tomto případě jde ještě navíc o to, že ta //poptávka// je myšlená obecně, zatímco v případě //nulového zájmu// jde o poptávku po papíře.) Je to podobné jako ten případ //inflace// -- //tříprocentní inflace//, který jsme ale, pokud vím, zatím nevyřešili.  | |

[ Back to the navigation ] [ Back to the content ]