Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
diskuzepedt [2012/06/13 13:06] nedoluzko |
diskuzepedt [2012/06/20 11:49] ufal |
| |
| ^ problém ^ diskuze, řešení ^ techn.pozn. ^ | | ^ problém ^ diskuze, řešení ^ techn.pozn. ^ |
^ AN, 3.6. | koreference 1. a 2. osoby | Neznacte "exoph" u //we//, pokud vyskytuje poprve, napr. v: `//`We have no useful information on whether users are at risk,'' said James A. Talcott of Boston's Dana-Farber Cancer Institute.// S tim we se muze spojovat jenom normalni textova koreference, pokud jsou pak vyjmenovani ti, kteri to //we// jsou. | | | ^ LH, 20.6. | apozice | Mám tu apozici //A high-balance customer that banks pine for, she [didn't give much thought to the rates]//. V takovém případě vedeme šipky taky přes kořen apozice, že? A co v případě //customers such as Ms. Driskill//? Tam bych docela ráda vedla šipku značící koreferenci oné dámy jen k jejímu jménu, protože celá apozice už značí něco jiného... | | |
| ^ LH, 16.6. | stát vs. hlavní město | Jak značit případy, kdy název hlavního města označuje střídavě hlavní město a celý stát? Budou z toho dva izolované řetězce, přičemž ten název hlavního města připadne podle významu pokaždé jinam? Mám tu případ jednání mezi Japonskem a USA, kde se na "the two countries" odkazuje taky pomocí "Washington and Tokyo", ale o pár vět vedle se mluví o událostech přímo v daném městě nebo státě. Tady bude "Washington and Tokyo" odkazovat k "the two countries" a v dalších výskytech např. "v USA" bude navázané ve stejném řetězci s Washingtonem z téhle koordinace, ale "v Tokiu" s tím označujícím stát nebude ve stejném řetězci? Doufám, že se vyjadřuju srozumitelně :) **JP:** Předpokládám, že by to mělo být přesně tak, jak píšeš. Tj. pokud Washington referuje ke státu, je to koreferenční s USA, pokud k městu, tak je to zvláštní řetězec pro město. Ty dva Washingtony navzájem koreferenční nejsou. | | |
| ^ AN, 13.6. | opravy t-lemmat | Pokud je potreba zmenit t-lemma, ted to prosim docasne nemente, jenom piste do poznamky, ze je potreba zmenit. jde totiz o to, ze kdyz davame dohromady dve anotace, nejde prelit i tuto informaci. Az zacnete anotovat kazdy zvlast, bude to zase po starem. **KT:** A jaký typ poznámky máme v tom případě použít? **AN:** Nejakz novy a abz se nekriyil s tim, co tam uz mate. Treba coref_LEMMA ? **LH:** A když z daného uzlu nevede šipka (např. při změně z #PersPron na #Gen nebo když jde o antecedent), tak klasický anot_comment typu t-lemma? Neztratí se to potom? | | |
| ^ AN, 13.6. | koreference 1. a 2. osoby | Neznacte exoph u we, s tim we se muze spojovat jenom normalni textova koreference, pokud jsou pak vyjmenovani ti, kteri to //we// jsou. | | |
^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | | ^ KT, 13.6. | začleňování gramatických šipek | Musí gramatické šipky vždycky navazovat v řetězci? Například ve větě //"Boeing Co. said it is discussing plans *ICH*-1 with three of its regular Japanese suppliers * to possibly help *-2 build a larger version of its popular 767 twin-jet ."// je textový řetězec company-it-its-its, ale je tam navíc ještě potřeba začlenit gramatická šipka od ACT-cor u help. Tu ale nemá smysl napojovat k bezprostředně předcházejícímu its, ale spíš k PersPron pod discuss (nebo ještě lépe k ACT-cor pod plan a odtamtud k tomu PersPron), což ale znamená "odbočku" ze souvislého řetězce. Je to tak v pořádku? **AN:** Jo, je to tak v poradku. Ale jinak je textove koreferencni retezec propojen s gramatickou koreferenci automaticky. V datech, ktera ted anotujete se to dela samo pokud kreslite novou textovou sipku. Pokud vsak tam uz textova sipka byla, retezec se nedodrzuje 0 to se dodela automaticky po skonceni rucni anotace| | |
^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| | ^ JP, 5.6. | VerbPron | Budeme nějak řešit uzly s lemmatem VerbPron? Např. //"Signs of a slowing economy are increasing pressure on the Federal Reserve to cut short-term interest rates, but it isn't clear whether the central bank will __do so__."// "Do so" je v jednom uzlu jako VerbPron, teoreticky by se to mohlo odkázat na "cut". **LH:** Když jsme dělali koreferenci u Silvie, tak se na VerbPron textová koreference značila, tudíž bych to dělala i tady. Nevidím důvod neznačit. **JP:** Taky mi to tak přijde, jenom mě trochu znejistělo, že v češtině bylo pravidlo, že se koreference nedělá od sloves. Ale tady v tomhle případě asi jo.. **AN** Jo, urcite znacit. Dopisu to do manualu| dopsat do manualu| |