[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
diskuze [2009/10/19 10:38]
ufal
diskuze [2010/09/27 12:08] (current)
ufal
Line 3: Line 3:
  
 |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^ |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^
 +^ JP, 27.9. | Uzly s lemmatem Oblfm | Mají se anotovat uzly s lemmatem Oblfm, když je tam jasná koreference? Např. ve větě //Korunu všemu nasadil ministr Dlouhý tvrzením, že nebyl hodnější ten, kdo vstoupil do KSČ v r. 1963 a byl vyhozen v r. 1969 či 1970 než ten, kdo vstoupil v r. 1977 a vystoupil v r. 1989 jako on.// u doplnění sloves "vyhodit", "vstoupit" a "vystoupit" |  |
 +^ RO, 28.3. |postup při chybách ve stromě | Co v principu děláme, když je ve stromě evidentní chyba, např. kousek visí někde úplně jinde, než má viset? Anotujeme jakoby podle pořadí v textu s tím, že to bude ve stromě vypadat nestandardně? Nebo v takovém případě anotaci vynecháváme? **JP:** To by mě taky zajímalo. Že někde něco visí jinde, než by mělo, se občas stává, a je proto třeba rozhodnout, jestli se řídit podle smyslu, nebo podle té interpretace, kterou nabízí anotace (což ale občas není úplně možné, protože taková interpretace někdy vůbec smysl nedává). Na jinou evidentní chybu jsem narazil teď: //Nátlak na bosenské Srby musí pokračovat. Nemůže být ale uplatňován přes Slobodana Miloševiče, i když jeho prsty v Bosně sahají velmi daleko.// Ve druhé větě má patiens lemma #Gen, přestože by evidentně měl mít #PersPron (koreferenční s "nátlak". Pokud bych se měl řídit podle smyslu, udělal bych tam koreferenci, pokud podle chybné anotace, tak nic, protože u lemmatu #Gen se nic neanotuje. A další pěkná chyba: "Hradec Králové" jsem našel anotovaný tak, že řídící uzel je "Králová" a na něm visí "Hradec" s funktorem RSTR.  **AN:** Anotovat podle smyslu a chzbu hlasti mailem JM, ktery do dale preposle Honzovi Stepankovi |  |
 +^JP, 2. 3.| Vztah "USA" -- "Američané"  | Jaký je vztah mezi výrazy ve větách //Jestliže schůzka v Camp Davidu a následný izraelsko-egyptský mír přišel zjevně o deset let dříve, a to ještě jen kvůli silnému tlaku __Američanů__, pro summit mezi Izraelem a Sýrií by mohla být nyní ideální doba. __USA__ udělaly v celém mírovém procesu rozhodující krok, když dostrkaly země Blízkého východu k prvnímu společnému jednání v Madridu//? Byl bych asi pro v takových případech dávat koreferenci typu 0.  **RO:** Podle mě je tu možné i normální chápání stát-jeho obyvatelé, tak bych radši nechal REST a nekomplikoval to. Radši se v takových případech trošku držet té formy, pokud to není jednoznačně proti smyslu, jinak se zas nikdy neshodnem, kde přesně je ta hranice, kdy je ještě obyvatelské jméno koreferenční se státem.| |
 +^JP, 2. 3.| Vztah "Japonsko" -- "Tokio" | Pokud vím, dohodli jsme se, že v případech, kdy název hlavního města referuje ke státu, budeme takový výraz anotovat jako koreferenční s tím státem. Možná by ale bylo přesnější tam dávat vztah P-FUNCT. Např. ve větě //__Japonské__ síly se na Filipínách vzdaly v roce 1945, těsně předtím, než __Tokio__ kapitulovalo.// Co vy na to? A další hezký příklad: //Vyloučení __bývalé Jugoslávie__ z Organizace spojených národů (OSN) je ospravedlňováno tím, že __Bělehrad__ již nereprezentuje __stát, který zanikl__.// Tady by ta koreference byla hodně problematická, protože by tam musela vzniknout konstrukce typu "x nereprezentuje x". **RO:** Já myslím, že tak jsme se dohodli už původně. Aspoň já tam v takových případech P-FUNCT standardně dávám, určitě to není koreference, ale třeba "Rusko-Moskva" jako stát-jeho vedoucí místa.| |
 +^RO 26. 1.| "zaměstnanci" - "každý zaměstnanec" | Už jsme se dohodli, jestli v podobném užití označujeme koreferenci, nebo SET-SUB? **JP:** Já tam dávám rozhodně koreferenci. **RO** Mám tu obzvlášť zapeklitý případ: "Výkonný __výbor__ ČMFS se sešel k prvnímu jednání. Kromě rozdělení kompetencí mezi __jednotlivé členy__ připravil odvolací dopis (...) předseda k dělení kompetencí mezi __členy__ __výkonného výboru__ uvedl: Naším záměrem je rovnoměrně rozložit úkoly na __všechny členy__." Nestálo by ještě za to vytvořit nějakou kategorii pro tenhle distributivní pohled na tutéž entitu? Jak koreference, tak SUB-SET mi tu přijdou dost divné. **JP:** V distributivnosti obecně určitě problém je, ale tohle mi přijde ještě docela dobré. Dal bych koreferenci typu 0 jenom mezi "výbor" a "výbor", a všechny "členy" bych propojil taky koreferencí typu 0. Tady myslím problém není - vždyť je tu možné všechny ty členy substituovat spojením "jednotlivé členy". Horší je to v takových případech jako "všichni účastníci dohromady mají hodně, ale každý účastník jednotlivě nemá nic". | |
 +^RO 26. 1.| "stát"- "republika" jako FUNCT-P?  | Někdy se objevuje uzel "stát" jako výrazně nekoreferenční s "ČR", "republika" apod., např. když jde o financování ze státního rozpočtu (a ne z regionálních rozpočtů), státní sféru (x soukromou sféru). Dávám tam pak "stát" jako FUNCT, souhlasíte? **JP:** Jo, to jsem si taky říkal, že by se mohlo...  | |
 +^JP, 18. 12.| koreference s větným antecedentem typu NR  | Slibovaný příklad: //"__Novinář se činovníka ptá na to, na co by se ptal občan, kdyby měl k tomu možnost.__ Činovníkovi je __to__ mnohdy nepříjemné, obtěžuje ho __to__."// U obou zájmen dávám typ NR, antecedentem je generická propozice s generalizací nad situacemi, tj. jde o opakované ptaní, které je ve druhé větě pojímáno genericky.  | |
 +^AN, 13. 11.| vysledky schuzky  | **1) titulky: ** anotujeme, typ vztahu podle smyslu. Pokud vyrazna viceznacnost, tak mozna chapat titulek "generictejsim" zpusobem\\ **2) NR u #PersPron: ** pokud puvodni zajmenna koreference je genericka, menime typ O na NR\\ **3) koreference v predikacnich konstrukcich: ** zustava, jak bylo, t.j. standardni predikaci mezi subjektem a jmennou casti prisudku neanotujeme. Avsak pokud jmenna cast prisudku neprisuzuje vlastnost, ale ma vlastni referenci, muze klidne slouzit jako antecedent koreferencniho vztahu. Strucne receno, zachazime s predikacni casti jako se slovesem: neni predmetem anotace koreference, ale pokud musi, muze byt antecedentem.\\ **4) koreference adjektiv typu //vladni, statni//: ** anotovat, pokud maji specificky referent (typ 0) a neanotovat u generickych (NR) a v jinych pripadech.  **RO** ad 2 - ale jen v případech, kde řetězec dál pokračuje? U všech PersPron to přece rozhodovat nemůžem, je jich moc; a pak je zas otázka, jestli má smysl to dělat jen u některých.. **JP:** Já to dělám u všech... **RO:** U všech? Tak já to taky zkusím, ale bojím se, že si všeho nevšimnu - už jsem si dost zvykl jít po textu a na PersProny se nekoukat. | |
 +^RO, 13. 11.| "jeden z X"  | Značíme častou konstrukci "jeden z (nejúspěšnějších podnikatelů...)" jako SUB-SET? Já jsem to zatím dělal, protože tam je funktor DIR1 a tou podmnožinou se to upřesní, ale nevím. **JP:** Jasně, značíme, to už jsme někdy řešili. **AN**: jo, jo , znacime | |
 +^JP, 26.10.| Různé "důvěry"  | //Nejvíce důvěry vkládají občané ČR ve své nejbližší okolí a v sebe samé. Nejméně důvěry vkládají občané České republiky do politiků. Důvěru píšícím novinářům vyslovilo 58 procent obyvatel, starostům a primátorům 43 procent dotázaných. Vyšší procento důvěry v politiky se vyskytuje u potenciálních voličů ODS než u voličů opozičních stran.// Jaké jsou vztahy mezi těmi důvěrami? U posledních dvou vět je to poměrně jasnější, protože tam ty důvěry mají nějaké vlastní argumenty, které jsou s něčím koreferenční (s novináři či politiky). U prvních dvou vět by se to snad dalo označit za generickou, obecnou důvěru, která se v něco vkládá, ale problém je v tom, že to "nejvíce" a "nejméně" tam figuruje jako rozvití těch důvěr, takže koreferenci tam asi značit nelze. **AN**: Ja bych to vubec neznacila. | |
 +^JP, 26.10.| Nejasná extenze u generických NP  | Celý článek pojednává o průzkumu mezi lidmi o tom, komu nejvíce důvěřují. A jsou tam věty typu //"Lidé důvěřují více svým partnerům než sobě samým.// Jaký je tady vztah mezi "lidmi" a "partnery"? Teoreticky vzato by tam mohla být dokonce i koreference, protože ty množiny jsou prakticky asi totožné, i když v jednotlivých případech ty jejich prvky nikdy totožné nejsou. Podobných vět je v tom článku hodně, např. ty, kde by se mohla označovat podmnožina (//Svému nejbližšímu nadřízenému věří 67 procent lidí. Nejméně důvěry vkládají občané České republiky do politiků.//) Já jsem tam nikde neoznačoval nic, protože by to bylo dost šílené, ale to asi není úplně dobrý argument... **RO** V tom druhém případě bych asi klidně vyznačil aspoň koreferenci 0 mezi "lidí"-"občané". V prvním případě bych neznačil nic, stejně je vztah už naznačen skrz to "svým". Extenze je důležitá, ale nemůžem ji brát vždycky úplně, občas je záměr textu jinej. | |
 ^JP, 8.10.| Obrat v loňském roce vs. obrat letos  | //Její __obrat__ podle předběžných výsledků činí za loňský rok téměř 1133 miliardy korun, __zisk__ před zdaněním je vypočten na 64.8 miliónu korun. Letos by se měl __obrat__ pohybovat okolo 1.2 miliardy korun a __zisk__ by měl zůstat na úrovni roku 1994.// Má se anotovat nějaký vztah mezi obraty a mezi zisky? Ve skutečnosti to koreferenční není, i když syntaktická struktura se tváří, jako kdyby bylo (to časové určení tam nefunguje jako rozvití substantiva, ale jako doplnění slovesa), a možná by to tak i šlo chápat, pokud by se to bralo jako nereferenční. V případě, že by to ve druhé větě bylo pronominalizované, byl by tam zřejmě typ ANAF, ale v tomhle případě to anafora asi není. Pak se nabízí ještě REST...  | | ^JP, 8.10.| Obrat v loňském roce vs. obrat letos  | //Její __obrat__ podle předběžných výsledků činí za loňský rok téměř 1133 miliardy korun, __zisk__ před zdaněním je vypočten na 64.8 miliónu korun. Letos by se měl __obrat__ pohybovat okolo 1.2 miliardy korun a __zisk__ by měl zůstat na úrovni roku 1994.// Má se anotovat nějaký vztah mezi obraty a mezi zisky? Ve skutečnosti to koreferenční není, i když syntaktická struktura se tváří, jako kdyby bylo (to časové určení tam nefunguje jako rozvití substantiva, ale jako doplnění slovesa), a možná by to tak i šlo chápat, pokud by se to bralo jako nereferenční. V případě, že by to ve druhé větě bylo pronominalizované, byl by tam zřejmě typ ANAF, ale v tomhle případě to anafora asi není. Pak se nabízí ještě REST...  | |
 ^RO, 8.10.| Příklad mísení specifické a nespecifické reference v jednom řetězci  | Shodli jsme se kdysi, že je někdy nutné spojovat typ O a NR do jednoho řetězce, dobrý příklad je:  "Po **schůzce** Moravčík-Boross. ... **Setkání** (typ 0) premiérů Maďarska a Slovenska, které se uskutečnilo v neděli večer... ... Proto začal premiér Boross projevovat zájem o **setkání** (NR) s Moravčíkem. ... A tak se **setkání** (NR) Moravčík-Borros nejdřív odložilo, pak se uvažovalo o jeho zrušení, ale jelikož měli oba premiéři na **schůzce** (NR) zájem, dohodli se na kompromisu. ... **Schůzka** (typ 0) byla, ale neformální." Mísí se tam pohled na věc (schůzka) jakožto už proběhlou (specifikovanou) / jakožto teprve budoucí a nepříliš určenou. Je samozřejmě otázka, jestli jde ještě o tutéž entitu, ale koheze textu evidentně stojí na tom, že jde o schůzku mezi premiéry. Ale takových případů bychom asi měli mít co nejmíň, na tom se málokdy shodnem. **AN**: Vyborny priklad! **JP:** Podobný případ je: //Podle včerejších slov Evžena Teršla z firmy Trade Center měli squateři stejnou možnost získat Ladronku jako jiné organizace. Museli vyhotovit architektonickou studii stavby a __projekt__ na její využití. To squateři již jako nadace Ladronka učinili. Stavební část __projektu__ prý pro ně vypracovali studenti 3. ročníku Fakulty architektury ČVUT.// Ale nejsem si moc jistý, že by se tyto případy měly anotovat jako koreferenční...  |-->M | ^RO, 8.10.| Příklad mísení specifické a nespecifické reference v jednom řetězci  | Shodli jsme se kdysi, že je někdy nutné spojovat typ O a NR do jednoho řetězce, dobrý příklad je:  "Po **schůzce** Moravčík-Boross. ... **Setkání** (typ 0) premiérů Maďarska a Slovenska, které se uskutečnilo v neděli večer... ... Proto začal premiér Boross projevovat zájem o **setkání** (NR) s Moravčíkem. ... A tak se **setkání** (NR) Moravčík-Borros nejdřív odložilo, pak se uvažovalo o jeho zrušení, ale jelikož měli oba premiéři na **schůzce** (NR) zájem, dohodli se na kompromisu. ... **Schůzka** (typ 0) byla, ale neformální." Mísí se tam pohled na věc (schůzka) jakožto už proběhlou (specifikovanou) / jakožto teprve budoucí a nepříliš určenou. Je samozřejmě otázka, jestli jde ještě o tutéž entitu, ale koheze textu evidentně stojí na tom, že jde o schůzku mezi premiéry. Ale takových případů bychom asi měli mít co nejmíň, na tom se málokdy shodnem. **AN**: Vyborny priklad! **JP:** Podobný případ je: //Podle včerejších slov Evžena Teršla z firmy Trade Center měli squateři stejnou možnost získat Ladronku jako jiné organizace. Museli vyhotovit architektonickou studii stavby a __projekt__ na její využití. To squateři již jako nadace Ladronka učinili. Stavební část __projektu__ prý pro ně vypracovali studenti 3. ročníku Fakulty architektury ČVUT.// Ale nejsem si moc jistý, že by se tyto případy měly anotovat jako koreferenční...  |-->M |

[ Back to the navigation ] [ Back to the content ]