Both sides previous revision
Previous revision
Next revision
|
Previous revision
|
diskuzepedt [2012/06/13 13:01] nedoluzko |
diskuzepedt [2012/10/04 11:18] (current) fucikova |
| |
| ^ problém ^ diskuze, řešení ^ techn.pozn. ^ | | ^ problém ^ diskuze, řešení ^ techn.pozn. ^ |
^ AN, 13.6. | koreference 1. a 2. osoby | Neznacte "exoph" u //we//, pokud vyskytuje poprve, napr. v: `//`We have no useful information on whether users are at risk,'' said *T*-1 James A. Talcott of Boston's Dana-Farber Cancer Institute.// S tim we se muze spojovat jenom normalni textova koreference, pokud jsou pak vyjmenovani ti, kteri to //we// jsou. | | | ^ LH, 25.9. | SPEC vs. GEN | Nevím, jak vy ostatní, ale já velmi často váhám, jestli mám mezi nějakými dvěma nominálními zmínkami udělat koreferenci - zejména když mají určitý člen a označují totéž, ale jsou abstraktní nebo mají spíš generický charakter, jako např. //the market// (ne ve významu konkrétní burzy, ale trhu) nebo //the Japanese culture//. Při rozhodování si pomáhám tím, jestli jde v roli determinantu použít "this" nebo "that", což by snad mělo jít jen u typu SPEC. Máte taky takové rozlišovací problémy? A pokud ano, jak je řešíte? | | |
| ^ AN, 18.9. | premodifiers | cim dale uvazuju o premodifiers, tim vic si myslim, ze pokud to nejsou proper nouns a nemaji pri sobe svuj vlastni urcity clan, nemame je anotovat. Vychazi to dost nekonzekventne. Takze asi momentalne to anotujte, ale davejte tam kommentar "premod"| | |
| ^ JP, 4.9. | Premodifiers?? | Teď jsem si uvědmil, že mi není jasná zásadní věc: anotují se premodifiers, pokud jsou to substantiva? Např. "__The gross national product__ report" nebo "__dividend__ boost". V manuálu se píše o tom, že premodifiers, které jsou vlastními jmény, tak se anotují, ale o obecných jménech jsem nikde nic nenašel. V ON se to zřejmě nedělalo, ale já jsem to doteď dost pravidelně dělal, tak nevím, jestli je to správně. Někdy teda mám trochu problém rozlišit, jestli je něco substantivum nebo adjektivum, ale v takových případech se dá řídit tou anotací.. **LH:** Tohleto já značím. **AN:** Tak fakt asi znacit. ON o tom nepisou moc, uvadeji jenom, ze se v te pozici naemaji znacit adjektiva, ale substantiva ano, ale uvadeji priklad na proper nouns. Jinak se o nich vsude pise, ze to znaci. Neznaci to MATE, coz mi prijde v necem i logictejsi. Problem je v tom, ze v anglictine substantivni/adjektivni povaha neni vzdy uplne zrejma | | |
| ^ KT, 20.8. | uzly #Compar | Narazila jsem teď dvakrát ve srovnávací konstrukci na uzel #Compar, který z t-roviny vůbec neznám. (Např. //"profitable operations in the U.S. have been the exceptions rather than the rule"// - Compar je jako ACT pod zkopírovaným "be".CPR, které má jako PAT "the rule"). Na t-rovině je to spojené růžovou šipkou, v zobrazení pro bridging žádná šipka není. Máme tam značit koreferenci? Zatím jsem to tak dělala. | EF, 4.10.Uzly #Compar dodelaval Vojta, jejich smysl vam objasni bud on nebo Silvie| |
| ^ JP, 14.8. | //"a year earlier"// / //"the year earlier"// vs. //"last year"// | Zajímavým a častým případem, který by bylo dobré sjednotit, je anotace uvedených výrazů. //"Last year"// podle mě jasně referuje k určitému roku. Jinak to vidím u //"a/the year earlier"//, kde to celé spojení referuje k nějakému času před rokem, zatímco to //"year"// referuje k časovému období, které trvá rok a končí současností, tj. nic v tomto spojení nereferuje k minulému roku, tj. nepropojuji to s //"last year"// ani s ničím jiným. Tak doufám, že ostatní to dělají podobně :) **LH:** Nad tímhle jsem taky dost dumala, nejdřív jsem to coby koreferenční propojovala (ten rozdíl ve významu, co popisuješ, mě nenapadl, ostatně ve většině kontextů je to vzájemně zaměnitelné), ale pak jsem svoje stanovisko přehodnotila - taky kvůli tomu, že v //"a/the year earlier"// bývá řídícím uzlem adverbium a to se mi moc nelíbí. Takže teď už to taky do řetězce nepřidávám. :) | | |
| ^ JP, 26.7. | Příklad konfliktu kritérií generičnosti a určitosti | Kdysi jsem upozorňoval, že i generické výrazy mohou mít určitou referenci, a byl jsem dotazován na příklad. Nyní jsem na pěkný narazil: //"But the two legal experts (...) wrote in a joint letter that __the president__ lacks the constitutional authority to exercise a line-item veto. (...) |
| The two professors said the Constitution authorizes __the president__ to veto entire bills, not partial measures. (...) They also said that more than a dozen presidents *PPA*-1 have called for line-item veto authority since the Civil War, and all have shared the view that such lawmaking power is beyond the reach of __the president__. Sen. Kennedy said in a separate statement that he supports legislation to give __the president__ line-item veto power, but that it would be a reckless course of action for President Bush to claim the authority without congressional approval."// Jelikož je to generické, tak to nepropojuji, ale ta určitost tu je. | | |
| ^ JP, 25.7. | typ "programs like this" | Jak budeme řešit typ "substantivum like this"? Např. //"They take place in government programs that seem tailor-made for corruption. Why are __programs like this__ not eliminated?"// Je to sice generické, ale odkazuje to, takže by se to mělo anotovat. Propojil bych to "programs" a "programs". Druhou možností by bylo odkázat to z toho "this", ale to mi přijde zbytečné. **LH:** Hm, já bych vložila poznámku k "this" a nechala bych to celé bez šipky až do doby, kdy budeme dělat generický typ. **JP:** No ale generické výrazy anotujeme, pokud anaforicky odkazují, což je tady splněno. | | |
| ^ LH, 26.6. | SEGM katafora? | Mám tady zajímavý případ, kdy se kataforicky odkazuje na následující text: //The key U.S. and foreign annual interest rates below [are a guide to general levels blablabla]//, na což navazuje výčet jednotlivých sazeb. Mám to označit jako SEGM? Nebo se to bude řešit nějakým bridgingem? **JP:** Asi bych to dělal tím segmentem. Dalším příkladem může být věta: //"__The following__ were among yesterday's offerings and pricings in the U.S. and non-U.S. capital markets, with terms and syndicate manager, as compiled by Dow Jones Capital Markets Report:"// | | |
| ^ JP, 26.6. | generická "you" | Mají se propojovat navzájem generická "you"? Na jednu stranu je to generické, na druhou jsou to zájmena, i když ne endoforicky deiktická. Zvlášť ale pokud je to v jedné větě, tak mi to přijde hloupé neznačit, např. //You're dead in the water if you aren't segmenting the market//. **LH:** Já bych to propojovala, když na sebe takhle očividně navazují: to první může značit jakoukoli množinu, ale to druhé už označuje tu samou, jako to první, je to koreferenční. | | |
| ^ JP, 20.6. | typ "the bells themselves" | Má se v takovém případě značit koreference u výrazu "themselves"? Je to zájmeno s lemmatem PersPron, takže by se asi měla, i když to asi vypadá trochu divně. A jestli jo, tak jaká? Gramatická? **LH:** Já bych tam určitě značila gramatickou koreferenci. | | |
| ^ LH, 20.6. | apozice | Mám tu apozici //A high-balance customer that banks pine for, she [didn't give much thought to the rates]//. V takovém případě vedeme šipky taky přes kořen apozice, že? A co v případě //customers such as Ms. Driskill//? Tam bych docela ráda vedla šipku značící koreferenci oné dámy jen k jejímu jménu, protože celá apozice už značí něco jiného... **JP:** Taky bych to tam dělal, na kořen to tu rozhodně nejde, jedině že by se to neznačilo vůbec, což by byla škoda. Ale je to docela zásadní, protože to pravidlo o apozicích bylo celkem striktní.. | | |
| ^ LH, 16.6. | stát vs. hlavní město | Jak značit případy, kdy název hlavního města označuje střídavě hlavní město a celý stát? Budou z toho dva izolované řetězce, přičemž ten název hlavního města připadne podle významu pokaždé jinam? Mám tu případ jednání mezi Japonskem a USA, kde se na "the two countries" odkazuje taky pomocí "Washington and Tokyo", ale o pár vět vedle se mluví o událostech přímo v daném městě nebo státě. Tady bude "Washington and Tokyo" odkazovat k "the two countries" a v dalších výskytech např. "v USA" bude navázané ve stejném řetězci s Washingtonem z téhle koordinace, ale "v Tokiu" s tím označujícím stát nebude ve stejném řetězci? Doufám, že se vyjadřuju srozumitelně :) **JP:** Předpokládám, že by to mělo být přesně tak, jak píšeš. Tj. pokud Washington referuje ke státu, je to koreferenční s USA, pokud k městu, tak je to zvláštní řetězec pro město. Ty dva Washingtony navzájem koreferenční nejsou. | | |
| ^ AN, 13.6. | opravy t-lemmat | Pokud je potreba zmenit t-lemma, ted to prosim docasne nemente, jenom piste do poznamky, ze je potreba zmenit. jde totiz o to, ze kdyz davame dohromady dve anotace, nejde prelit i tuto informaci. Az zacnete anotovat kazdy zvlast, bude to zase po starem. **KT:** A jaký typ poznámky máme v tom případě použít? **AN:** Nejakz novy a abz se nekriyil s tim, co tam uz mate. Treba coref_LEMMA ? **LH:** A když z daného uzlu nevede šipka (např. při změně z #PersPron na #Gen nebo když jde o antecedent), tak klasický anot_comment typu t-lemma? Neztratí se to potom? **KT:** Pokud je to antecedent, tak poznámku píšu k šipce z předchozího uzlu s upozorněním, že se vztahuje k antecedentu.. Doufám, že takhle se spíš nepřehlédne..| | |
| ^ AN, 13.6. | koreference 1. a 2. osoby | Neznacte exoph u we, s tim we se muze spojovat jenom normalni textova koreference, pokud jsou pak vyjmenovani ti, kteri to //we// jsou. | | |
^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | | ^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | |
^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| | ^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| |