Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
diskuzepedt [2012/06/13 13:05] nedoluzko |
diskuzepedt [2012/07/17 10:10] ufal |
| |
| ^ problém ^ diskuze, řešení ^ techn.pozn. ^ | | ^ problém ^ diskuze, řešení ^ techn.pozn. ^ |
^ AN, 3.6. | koreference 1. a 2. osoby | piste prosim vlastni text do hranatych zavorek, je to pak lepe vyhledavatelne, tj. AMBIG [Vas text] Pokud vam nebudou stacit AMBIG a OTHER a vidite jinou typove vyclenitelnou skupinku, nabidnete, dame ji tam taky **JP:** Platí to i teď, když už na to existují ty kategorie v Tredu? **AN:** ne, pardon, to jsem psala, kdyz jsem se divala na stara data :-) | | | ^ LH, 26.6. | SEGM katafora? | Mám tady zajímavý případ, kdy se kataforicky odkazuje na následující text: //The key U.S. and foreign annual interest rates below [are a guide to general levels blablabla]//, na což navazuje výčet jednotlivých sazeb. Mám to označit jako SEGM? Nebo se to bude řešit nějakým bridgingem? **JP:** Asi bych to dělal tím segmentem. Dalším příkladem může být věta: //"__The following__ were among yesterday's offerings and pricings in the U.S. and non-U.S. capital markets, with terms and syndicate manager, as compiled by Dow Jones Capital Markets Report:"// | | |
| ^ JP, 26.6. | generická "you" | Mají se propojovat navzájem generická "you"? Na jednu stranu je to generické, na druhou jsou to zájmena, i když ne endoforicky deiktická. Zvlášť ale pokud je to v jedné větě, tak mi to přijde hloupé neznačit, např. //You're dead in the water if you aren't segmenting the market//. **LH:** Já bych to propojovala, když na sebe takhle očividně navazují: to první může značit jakoukoli množinu, ale to druhé už označuje tu samou, jako to první, je to koreferenční. | | |
| ^ JP, 20.6. | typ "the bells themselves" | Má se v takovém případě značit koreference u výrazu "themselves"? Je to zájmeno s lemmatem PersPron, takže by se asi měla, i když to asi vypadá trochu divně. A jestli jo, tak jaká? Gramatická? **LH:** Já bych tam určitě značila gramatickou koreferenci. | | |
| ^ LH, 20.6. | apozice | Mám tu apozici //A high-balance customer that banks pine for, she [didn't give much thought to the rates]//. V takovém případě vedeme šipky taky přes kořen apozice, že? A co v případě //customers such as Ms. Driskill//? Tam bych docela ráda vedla šipku značící koreferenci oné dámy jen k jejímu jménu, protože celá apozice už značí něco jiného... **JP:** Taky bych to tam dělal, na kořen to tu rozhodně nejde, jedině že by se to neznačilo vůbec, což by byla škoda. Ale je to docela zásadní, protože to pravidlo o apozicích bylo celkem striktní.. | | |
| ^ LH, 16.6. | stát vs. hlavní město | Jak značit případy, kdy název hlavního města označuje střídavě hlavní město a celý stát? Budou z toho dva izolované řetězce, přičemž ten název hlavního města připadne podle významu pokaždé jinam? Mám tu případ jednání mezi Japonskem a USA, kde se na "the two countries" odkazuje taky pomocí "Washington and Tokyo", ale o pár vět vedle se mluví o událostech přímo v daném městě nebo státě. Tady bude "Washington and Tokyo" odkazovat k "the two countries" a v dalších výskytech např. "v USA" bude navázané ve stejném řetězci s Washingtonem z téhle koordinace, ale "v Tokiu" s tím označujícím stát nebude ve stejném řetězci? Doufám, že se vyjadřuju srozumitelně :) **JP:** Předpokládám, že by to mělo být přesně tak, jak píšeš. Tj. pokud Washington referuje ke státu, je to koreferenční s USA, pokud k městu, tak je to zvláštní řetězec pro město. Ty dva Washingtony navzájem koreferenční nejsou. | | |
| ^ AN, 13.6. | opravy t-lemmat | Pokud je potreba zmenit t-lemma, ted to prosim docasne nemente, jenom piste do poznamky, ze je potreba zmenit. jde totiz o to, ze kdyz davame dohromady dve anotace, nejde prelit i tuto informaci. Az zacnete anotovat kazdy zvlast, bude to zase po starem. **KT:** A jaký typ poznámky máme v tom případě použít? **AN:** Nejakz novy a abz se nekriyil s tim, co tam uz mate. Treba coref_LEMMA ? **LH:** A když z daného uzlu nevede šipka (např. při změně z #PersPron na #Gen nebo když jde o antecedent), tak klasický anot_comment typu t-lemma? Neztratí se to potom? **KT:** Pokud je to antecedent, tak poznámku píšu k šipce z předchozího uzlu s upozorněním, že se vztahuje k antecedentu.. Doufám, že takhle se spíš nepřehlédne..| | |
| ^ AN, 13.6. | koreference 1. a 2. osoby | Neznacte exoph u we, s tim we se muze spojovat jenom normalni textova koreference, pokud jsou pak vyjmenovani ti, kteri to //we// jsou. | | |
^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | | ^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | |
^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| | ^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| |