[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
diskuzepedt [2012/04/11 15:53]
ufal vytvořeno
diskuzepedt [2012/05/26 10:11]
ufal
Line 1: Line 1:
 +
 |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^ |              ^ problém            ^ diskuze, řešení          ^ techn.pozn.        ^
-^ JP, 27.9. | Uzly s lemmatem Oblfm | Mají se anotovat uzly s lemmatem Oblfm, když je tam jasná koreference? Např. ve větě //Korunu všemu nasadil ministr Dlouhý tvrzením, že nebyl hodnější tenkdo vstoupil do KSČ v r1963 byl vyhozen v r1969 č1970 než tenkdo vstoupil v r1977 a vystoupil r1989 jako on.// u doplnění sloves "vyhodit", "vstoupit" a "vystoupit".   | +^ KT, 26.5. | bridging v řetězci  | Máme se snažit ten náš bridging nějak zakomponovat do koreferenčních řetězců, nebo stojí úplně mimo? Mám třeba větu: 24/7 The Perch and Dolphin fields are expected *-3 to start *-1 producing early next year , and the Seahorse and Tarwhine fields later next year . (a pak ještě páté pole zmíěnné někde předtím) a ve větách předtím i potom se mluví o "five fields". Má jít v tom případě textový řetězec mezi všemi výsykyty "five fields" apod. a potom od "fields" ve větě po té citované ještě navíc (kromě textové šipky ob větu zpátky) taky bridgingové šipky k těm pěti polím?| | 
-RO28.3. |postup i chybách ve stromě | Co v principu dělámekdyž je ve stromě evidentní chybanapřkousek visí někde úplně jindenež má visetAnotujeme jakoby podle pořadí textu tím, že to bude ve stromě vypadat nestandardně? Nebo v takovém případě anotaci vynecháváme? **JP:** To by mě taky zajímaloŽněkde něco visí jindenež by mělo, se občas stává, a je proto třeba rozhodnoutjestli se řídit podle smyslu, nebo podle té interpretacekterou nabízí anotace (což ale občas není úplně možnéprotože taková interpretace někdy vůbec smysl nedává). Na jinou evidentní chybu jsem narazil teď: //Nátlak na bosenské Srby musí pokračovatNemůže být ale uplatňován přes Slobodana Miloševičei když jeho prsty v Bosně sahají velmi daleko.// Ve druhé větě má patiens lemma #Gen, přestože by evidentně měl mít #PersPron (koreferenční s "nátlak". Pokud bych se měl řídit podle smysluudělal bych tam koreferencipokud podle chybné anotace, tak nicprotože u lemmatu #Gen se nic neanotuje. A další kná chyba: "Hradec Králové" jsem našel anotovaný tak, žřídící uzel je "Králová" a na něm visí "Hradecs funktorem RSTR.  **AN:** Anotovat podle smyslu chzbu hlasti mailem JMktery do dale preposle Honzovi Stepankovi |  |+^ JP, 25.5. | typ "the Soviets"  | Mají se výrazy typu "the Soviets" anotovat jako koreferenční se státem? Např. ve větě //"Howeverafter two meetings with **the Soviets**, a State Department spokesman said that it's ``too early to say'' whether that will happen."// mi to přijde docela logické (když se tak mají anotovat i výrazy typu "Moscow". \\ **AN** Jourcite anotovat.| |   
 +^ JP, 25.5. | 1. a 2osoby  | Platí v angličtině, že se neanotují zájmena první a druhé osoby? (V češtině se neanotovalaale možná se to bude teď doplňovat, tak jestli by to nestálo za to třeba udělat tady rovnou..)  \\ **AN** Ale urcite anotovat! je to i tom predbeznem manualku, ktery jsem posilala pred anotaci | |   
 +^ JP, 25.5| Co to jsou named-entities?  | Chápe se jako named-entity i něco, co nemá funktor NE nebo ID? Např. jsem narazil na "Spain Fund", což je název fondu, ale "Spainmá funktor RSTR, tak nevím, jestli ho anotovat..  \\ **AN**  Spain Fund? To je nejaky divny... Ale pokud to neni zrovna Spanish, tak asi anotovat i kdyz je to RSTR. S poznamkou|   
 +JP25.5. | PersPron v apozici  | Narazil jsem na ípadkde je jednou částí apozice zájmeno "it". Jelikož je to osobní zájmeno, je tam už udělaná koreferenční šipkaa to na druhou část apozicePředpokládám správně, že se to má rušit\\ **AN**  Ano, rusit  | |   
 +^ JP, 22.5. | rušení původních šipek  | Některé z již existujících šipek spojují uzly, které nejsou koreferenční. Např. ve větě //"Current PCs are more than 50 times faster and have memory capacity 500 times greater than their 1977 counterparts."// Pod uzlem "great" visí povrchově nereprezentované uzly "have" a "PersPron", které vyjadřují, jakou kapacitu měly ty counterparts. A to "PersPron" je propojené "capacity". Koreference tam přitom neníprotože jednou jde o kapacitu těch dnešních počítačů, jednou o kapacitu těch starých. V češtině jsme tyhle šipky mazali a dávali tam bridging typu ANAF, což tady nejde. Co s tím? Mazat\\ **AN** No jo, ale pak tam zustane #PersPron bez sipky. Ne, nemazat, ale psat tam komentar, ze to v uzkem smyslu neni koreferencni, a ten ANAF tam prosim taky napisDiky. | |   
 +^ JP, 22.5. | "such"  | Nejsem si jistý, jestli je úplně vhodné to pravidlo, žvýraz s "such" se nikdy neoznačuje. Viz věta //"The declaration by Economy Minister Nestor Rapanelli is believed to be the first time such an action has been called for by an Argentine official of such stature."// U toho "such an action" je jasné, že se to označovat nemá. Ale co to "such stature"? Tam mi to přijde, že se to dá dobře chápat jako koreferenční s tím "Minister", tak bych to anotoval. Podobně jako se to dělalo v češtině: některé výrazy se slovem "takový" se anotovaly, pokud to podle významu byla koreferece, tj. pokud to šlo bez změny významu nahradit slovem "tento"  \\ **AN** ale jotaky mi to tak prijde. Muze se to v tom pripade anotovat|  |  
 +|^ EK21.5. | komentare | ty komentare mame psat do annot_comment, nebo primo k tem sipkam (tam je taky misto na komentar) ? \\ **AN** primo k sipkam. Bude to fungovat az Eva do prida do schematupo updatnuti rozsireni Bridging \\ **EK** no jo, ale jak mam udelat komentar, kdyz tam sipka neni? To je ten pripad, na ktery jsem se ptala na wiki - antecedent proste chybii kdyz logicky je jasne, ze tam nekde byl. Psala jsi, ze tam nemam davat nic, jenom komentar OTHER. \\ **AN** Tak to jsem nedomyslila. V takovych pripadech komentare patri uzlum. Jirka Mirovsky k tomu dodela makro, zatim to (snad) jde dodat rozkliknutim celeho uzlu. pokud nejde, tak brzy pujde, prave na tom pracujeme :-) Ale ostatni komentare davejte k sipce, abychom do nich nemuseli psat uzel antecedenta. |  | 
 +^ AN, 21.5. | **Zapis ze schuzky 17.4.12** |* u vyrazu s "such" se koreference az na pripady, kde je to jasne koreferencni nevyznacuje, protoze neodkazuji k tomutez objektu, ale k typu nebo vlastnosti   \\ * koreferenci mezi generickymi NP nevyznacujeme (e.g. Japanese investors)  \\ * pozor na exophoru (oznacujeme //this year//nikoliv vsak //yesterday// a //next year//) \\  * pri anotovani na textech (ale i na stromech) davame pozor, ze antecedent neni NE ani ID, ani primy potomek apozicni kontrukce   \\ * bridging SUBSET oznacujeme v pripade, kdy anafor = antecedent1 + antecedent2 \\  * kontrolujeme spravnost t-lemmat #PersPron a #Gen  \\  * muze se stat, ze jsou NP s urcitym clenem, ktere nemaji antecedent, ale je zvlastni kdyz je NP s ukazovacim zajmenem bez antecedenta. V tom pripade to chce komentar \\ * Oznacujeme vagni a viceznacne pripady komentarich. Typy budou jeste dodelany. Zatim to piste rucne KOREF AMBIG [text] \\ * Ostatni komentare - KOREF OTHER [text]. Jeste to s temi komentari domyslim  \\ * kataforicke konstrukce znacime jako kataforicke (sipka dopredue.g. v //Crude as they were, these early PCs triggered explosive product development ...// |  | 
 +^ KT, 18.4. | šipky u reflexivních zájmen | Ve vzorové větě 20/6 je od themselves k antecedentu gramatická i textová šipka, správně má být jen gramatická. V jiném módu než PML_T_bridging (např. PML_En_T) se zobrazuje jen gramatická šipka. \\ **AN** To nevaditady se nalozila nase gramaticka koreference na OntoNotesTo pak automaticky smazeme. |  | 
 +^ KT, 18.4. | chyby ve vzorovém souboru? | Ve větě 20/16 jsou od zájmena "he" dvě šipky do předchozí věty, jedna k apoziční čárce, jedna ke jménu. Správně má být pokud se nepletu jen ta k celé apozici. V té samé větě bych ještě vedla šipku od "this" ke slovesu "prompt" v předchozí větě. \\ **AN**  ahatak ty soubory budeme muset taky prochazet. Voni vlastne nejsou "vzorove", ale ty, na kterych je anotovana rozsirena koreference v OntoNotes. To ale nemusi vzdy uplne sedet s nasi anotaci. Ano, spravne ta sipka povede na celou apozicni konstrukci |  | 
 +^ KT, 18.4. | zobrazení šipek obecne | Mnou idělané šipky se zobrazí v mode PML_T_bridging, nejsou ale vidět v PML_En_T \\ **AN**  Je to v poradku. Ten nastroj se brzy doladi a bude to nejak jednotne.| 
 +^ JM, 19.5. | automatické řetězení | Občas se stane, že  |  | 
 +^ EK, 21.5. | koreference casu | Kdyz mam v jedne vete "in the early 1950's" a v dalsi "from 1953 to 1955", mam to znacit jako koreferenci? A "30 years ago", ktere se vztahuje ke stejne udalosti, se s tim ma spojit taky?  \\ **AN** No clovece nevim... co myslite? Vono je to de facto koreferencni, takze by bylo lito to neznacit. Ale neni to taky samozrejme. Asi znacit s komentarem do OTHER \\ **JP** Pokud je z kontextu jasné, že se jedná o identické období (tj. že třeba "in the early 1950's" nezahrnuje třeba i rok 1952)tak bych to dělal, jinak ne. |  | 
 +^ EK, 21.5. | odkaz na zbytek | Co delat s pripady typu: "From 33 men, who [...], 28 died. The five surviving men [...]" ? Jsou ti "men" koreferencni? Je tam urcity clenti druzi "men" se urcitym zpusobem vztahuji k tem prvnim, ale neda se rict, ze to jsou ti sami, tak nevim.  \\ **AN** neto urcite neznacit, to jsou ruzni men. Znacilo by se to jako bridging pokud bychom to delali\\ **LH** není to zrovna ten případ bridgingu, co děláme? Pokud se jedná o konkrétních 33 lidíz nichž 28 umřelo 5 přežilo...?
 +^ EK, 21.5. | odkaz na neco, co v textu nevidime, ale nekde predtim to muselo byt | Co mam delat s takovouhle vetou (0009/1): "Clark Vitulli was named president of **this** U.S. sales and marketing arm of Japanese auto maker Mazda.K cemu mam navazat "this arm"? Ta veta je v souboru 0009 prvni, ale zrejme navazuje na neco, co nevidimMam to oznacit jako segment, nebo exoforu, nebo neco jineho?  \\ **AN** je to zrejme divny pripad, asi ani ne uplne spravny. Nedavejte tam nic, ale piste to do komentaru k OTHER |  | 
 +^ EK, 21.5. | bridging sipky | technicky problem - kdyz vlozim blede modre bridgingove sipky, tak se neulozi. Kdyz pak soubor zavru zase otevrusipky tam nejsou. \\ **AN** Bude to fungovat az Eva prida atribut bridging do schematu, po updatnuti rozsireni Bridging. Psalo se to do jineho atributu, ktery nebyl v rozsireni.  |  |

[ Back to the navigation ] [ Back to the content ]