Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
diskuzepedt [2012/06/13 13:02] nedoluzko |
diskuzepedt [2012/08/14 18:26] ufal |
| |
| ^ problém ^ diskuze, řešení ^ techn.pozn. ^ | | ^ problém ^ diskuze, řešení ^ techn.pozn. ^ |
| ^ JP, 14.8. | //"a year earlier"// / //"the year earlier"// vs. //"last year"// | Zajímavým a častým případem, který by bylo dobré sjednotit, je anotace uvedených výrazů. //"Last year"// podle mě jasně referuje k určitému roku. Jinak to vidím u //"a/the year earlier"//, kde to celé spojení referuje k nějakému času před rokem, zatímco to //"year"// referuje k časovému období, které trvá rok a končí současností, tj. nic v tomto spojení nereferuje k minulému roku, tj. nepropojuji to s //"last year"// ani s ničím jiným. Tak doufám, že ostatní to dělají podobně :) | | |
| ^ JP, 26.7. | Příklad konfliktu kritérií generičnosti a určitosti | Kdysi jsem upozorňoval, že i generické výrazy mohou mít určitou referenci, a byl jsem dotazován na příklad. Nyní jsem na pěkný narazil: //"But the two legal experts (...) wrote in a joint letter that __the president__ lacks the constitutional authority to exercise a line-item veto. (...) |
| The two professors said the Constitution authorizes __the president__ to veto entire bills, not partial measures. (...) They also said that more than a dozen presidents *PPA*-1 have called for line-item veto authority since the Civil War, and all have shared the view that such lawmaking power is beyond the reach of __the president__. Sen. Kennedy said in a separate statement that he supports legislation to give __the president__ line-item veto power, but that it would be a reckless course of action for President Bush to claim the authority without congressional approval."// Jelikož je to generické, tak to nepropojuji, ale ta určitost tu je. | | |
| ^ JP, 25.7. | typ "programs like this" | Jak budeme řešit typ "substantivum like this"? Např. //"They take place in government programs that seem tailor-made for corruption. Why are __programs like this__ not eliminated?"// Je to sice generické, ale odkazuje to, takže by se to mělo anotovat. Propojil bych to "programs" a "programs". Druhou možností by bylo odkázat to z toho "this", ale to mi přijde zbytečné. **LH:** Hm, já bych vložila poznámku k "this" a nechala bych to celé bez šipky až do doby, kdy budeme dělat generický typ. **JP:** No ale generické výrazy anotujeme, pokud anaforicky odkazují, což je tady splněno. | | |
| ^ LH, 26.6. | SEGM katafora? | Mám tady zajímavý případ, kdy se kataforicky odkazuje na následující text: //The key U.S. and foreign annual interest rates below [are a guide to general levels blablabla]//, na což navazuje výčet jednotlivých sazeb. Mám to označit jako SEGM? Nebo se to bude řešit nějakým bridgingem? **JP:** Asi bych to dělal tím segmentem. Dalším příkladem může být věta: //"__The following__ were among yesterday's offerings and pricings in the U.S. and non-U.S. capital markets, with terms and syndicate manager, as compiled by Dow Jones Capital Markets Report:"// | | |
| ^ JP, 26.6. | generická "you" | Mají se propojovat navzájem generická "you"? Na jednu stranu je to generické, na druhou jsou to zájmena, i když ne endoforicky deiktická. Zvlášť ale pokud je to v jedné větě, tak mi to přijde hloupé neznačit, např. //You're dead in the water if you aren't segmenting the market//. **LH:** Já bych to propojovala, když na sebe takhle očividně navazují: to první může značit jakoukoli množinu, ale to druhé už označuje tu samou, jako to první, je to koreferenční. | | |
| ^ JP, 20.6. | typ "the bells themselves" | Má se v takovém případě značit koreference u výrazu "themselves"? Je to zájmeno s lemmatem PersPron, takže by se asi měla, i když to asi vypadá trochu divně. A jestli jo, tak jaká? Gramatická? **LH:** Já bych tam určitě značila gramatickou koreferenci. | | |
| ^ LH, 20.6. | apozice | Mám tu apozici //A high-balance customer that banks pine for, she [didn't give much thought to the rates]//. V takovém případě vedeme šipky taky přes kořen apozice, že? A co v případě //customers such as Ms. Driskill//? Tam bych docela ráda vedla šipku značící koreferenci oné dámy jen k jejímu jménu, protože celá apozice už značí něco jiného... **JP:** Taky bych to tam dělal, na kořen to tu rozhodně nejde, jedině že by se to neznačilo vůbec, což by byla škoda. Ale je to docela zásadní, protože to pravidlo o apozicích bylo celkem striktní.. | | |
| ^ LH, 16.6. | stát vs. hlavní město | Jak značit případy, kdy název hlavního města označuje střídavě hlavní město a celý stát? Budou z toho dva izolované řetězce, přičemž ten název hlavního města připadne podle významu pokaždé jinam? Mám tu případ jednání mezi Japonskem a USA, kde se na "the two countries" odkazuje taky pomocí "Washington and Tokyo", ale o pár vět vedle se mluví o událostech přímo v daném městě nebo státě. Tady bude "Washington and Tokyo" odkazovat k "the two countries" a v dalších výskytech např. "v USA" bude navázané ve stejném řetězci s Washingtonem z téhle koordinace, ale "v Tokiu" s tím označujícím stát nebude ve stejném řetězci? Doufám, že se vyjadřuju srozumitelně :) **JP:** Předpokládám, že by to mělo být přesně tak, jak píšeš. Tj. pokud Washington referuje ke státu, je to koreferenční s USA, pokud k městu, tak je to zvláštní řetězec pro město. Ty dva Washingtony navzájem koreferenční nejsou. | | |
| ^ AN, 13.6. | opravy t-lemmat | Pokud je potreba zmenit t-lemma, ted to prosim docasne nemente, jenom piste do poznamky, ze je potreba zmenit. jde totiz o to, ze kdyz davame dohromady dve anotace, nejde prelit i tuto informaci. Az zacnete anotovat kazdy zvlast, bude to zase po starem. **KT:** A jaký typ poznámky máme v tom případě použít? **AN:** Nejakz novy a abz se nekriyil s tim, co tam uz mate. Treba coref_LEMMA ? **LH:** A když z daného uzlu nevede šipka (např. při změně z #PersPron na #Gen nebo když jde o antecedent), tak klasický anot_comment typu t-lemma? Neztratí se to potom? **KT:** Pokud je to antecedent, tak poznámku píšu k šipce z předchozího uzlu s upozorněním, že se vztahuje k antecedentu.. Doufám, že takhle se spíš nepřehlédne..| | |
| ^ AN, 13.6. | koreference 1. a 2. osoby | Neznacte exoph u we, s tim we se muze spojovat jenom normalni textova koreference, pokud jsou pak vyjmenovani ti, kteri to //we// jsou. | | |
^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | | ^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | |
^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| | ^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| |