[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
diskuze [2009/04/15 21:11]
ufal
diskuze [2009/04/15 22:12]
ufal
Line 10: Line 10:
 ^ RO, 27. 3.| technické drobnosti| Mohli bychom příležitostně požádat Jiřího o úpravu programu, aby se v případě, kdy klávesou T nebo B zadáme šipku a pak nepotvrdíme konkrétní typ a zavřeme nabídku křížkem, žádná šipka nezakreslovala? Taky by byla příjemná možnost pohybovat se v horním okně kolečkem myši, protože Tred pořád někdy trochu nesmyslně roluje. **AN:** napsala jsem o tom Jirkovi|  | ^ RO, 27. 3.| technické drobnosti| Mohli bychom příležitostně požádat Jiřího o úpravu programu, aby se v případě, kdy klávesou T nebo B zadáme šipku a pak nepotvrdíme konkrétní typ a zavřeme nabídku křížkem, žádná šipka nezakreslovala? Taky by byla příjemná možnost pohybovat se v horním okně kolečkem myši, protože Tred pořád někdy trochu nesmyslně roluje. **AN:** napsala jsem o tom Jirkovi|  |
 ^ RO, 26. 3.| P-FUNCT| Díval jsem se na záznam prezentace, že zavládla skepse k typu P-FUNCT. Já bych se ho rád zastal, řekl bych, že intuitivně už jsme si ho vymezili docela dobře. Je to podle mě něco jako vztah, kdy jedna entita vykonává unikátní funkci v rámci jiné entity.  Proto trenér-mužstvo a premiér-vláda jsou funct, ale hráč-mužstvo a ministr-vláda SUB. Znovu bych teda navrhnul, aby ta entita ve funkci nemusel být jen jedinec, ale taky unikátní úřad, typ vláda-ČR, parlament-ČR, národní banka-ČR, magistrát-Praha. Z příkladů uváděných na prezentaci by opravdu farář-fara nemělo být nic (to je jako pes-bouda, maximálně REST:-)), ale farnost-farář už by byl P-FUNCT. Právník-kancelář nebo advokát-advokátní kancelář pravděpodobně nic, popř. rest (není to unikátní a není to už ani přibližně podmnožina nebo část); kdyby to byl ředitel nebo tajemník-advokátní kancelář, tak FUNCT. **AN:** jo, je to tak. S tim fara - farar, to je moje jazykova chyba (chybne jsem chapala slovo "fara")|  | ^ RO, 26. 3.| P-FUNCT| Díval jsem se na záznam prezentace, že zavládla skepse k typu P-FUNCT. Já bych se ho rád zastal, řekl bych, že intuitivně už jsme si ho vymezili docela dobře. Je to podle mě něco jako vztah, kdy jedna entita vykonává unikátní funkci v rámci jiné entity.  Proto trenér-mužstvo a premiér-vláda jsou funct, ale hráč-mužstvo a ministr-vláda SUB. Znovu bych teda navrhnul, aby ta entita ve funkci nemusel být jen jedinec, ale taky unikátní úřad, typ vláda-ČR, parlament-ČR, národní banka-ČR, magistrát-Praha. Z příkladů uváděných na prezentaci by opravdu farář-fara nemělo být nic (to je jako pes-bouda, maximálně REST:-)), ale farnost-farář už by byl P-FUNCT. Právník-kancelář nebo advokát-advokátní kancelář pravděpodobně nic, popř. rest (není to unikátní a není to už ani přibližně podmnožina nebo část); kdyby to byl ředitel nebo tajemník-advokátní kancelář, tak FUNCT. **AN:** jo, je to tak. S tim fara - farar, to je moje jazykova chyba (chybne jsem chapala slovo "fara")|  |
-^ JP, 21.3. | typ "řekl to..." | Často se stává, že se v textu objeví spojení "řekl to XX", přičemž zájmeno to odkazuje k celé předcházející větě. V rámci předchozí anotace pronominální koreference je to řečeno jako bridging, ale asi to není úplně správné a někde to dokonce může způsobovat problémy, např. zde: //"Kuchyňským nožem __ubodal__ v noci z neděle na pondělí třiačtyřicetiletý J. S. v kuchyni bytu v Pekařské ulici svou o jedenáct let mladší manželku. LN __to__ sdělil vyšetřovatel Krajského úřadu vyšetřování. Motivem __činu__, který pachatel sám ohlásil, byly déletrvající manželské neshody."// Výraz "to" ve druhé větě je zde anotován jako koreferenční s řídícím slovesem předcházející věty. Slovo "činu" ve třetí větě je pak koreferenční se slovesem "ubodal", ovšem nikoli s tím "to". Nebylo by tedy dobré tyto případy opravovat na bridging ANAF? Vím, že Radek jinde psal, že by to příliš komplikovalo situaci, protože např. v případě konstrukce "zmínil se o tom XX" by to podle významu naopak muselo zůstat jako koreference a byl by v tom chaos. Možná by se to ale dalo rozlišovat substitučním testem -- v případě, že jde zájmeno "to" nahradit spojením "tuto větu", je to ANAF, pokud ne (jako třeba u toho zmínil se -- nejde říct "zmínil se o této větě"), je to koreference...  **AN:** Souhlasim s Jirkou - ne vsude, ale podle smyslu pokud to patri pod ANAF, tak bych to opravovala. **RO** Moc se mi to nezdá, resp. není podle mě tak jednoznačné, že to zájmeno odkazuje na výpověď o situaci, a nikoli na situaci samu. Např. ten vyšetřovatel z případu určitě prostě informoval o situaci, aniž použil přesně danou větu (takže ani pro "říct" ten test moc nesedí. Jako metajazyk bych to snad bral jen v případě, že by předchozí věta byla v uvozovkách jako citace.) Takhle bychom jenom zkomplikovali shodu, která je teď automatická: co kdyby tam místo "řekl to" bylo "prohlásil to", "oznámil to", "sdělil to", "zmínil se o tom", "naznačil to"? Těžko bychom se ve všech případech shodli. Já bych tenhle typ do ANAFu nedával, podle mě je tam vždy nějaký odkaz k situaci samé. **AN:** mas pravdu, tim se to moc komplikuje. Tak ten pripad s kuchynskym nozem zustane viset jako problem, ale snad se to casto neopakuje.|   -->M | +^ JP, 21.3. | typ "řekl to..." | Často se stává, že se v textu objeví spojení "řekl to XX", přičemž zájmeno to odkazuje k celé předcházející větě. V rámci předchozí anotace pronominální koreference je to řečeno jako bridging, ale asi to není úplně správné a někde to dokonce může způsobovat problémy, např. zde: //"Kuchyňským nožem __ubodal__ v noci z neděle na pondělí třiačtyřicetiletý J. S. v kuchyni bytu v Pekařské ulici svou o jedenáct let mladší manželku. LN __to__ sdělil vyšetřovatel Krajského úřadu vyšetřování. Motivem __činu__, který pachatel sám ohlásil, byly déletrvající manželské neshody."// Výraz "to" ve druhé větě je zde anotován jako koreferenční s řídícím slovesem předcházející věty. Slovo "činu" ve třetí větě je pak koreferenční se slovesem "ubodal", ovšem nikoli s tím "to". Nebylo by tedy dobré tyto případy opravovat na bridging ANAF? Vím, že Radek jinde psal, že by to příliš komplikovalo situaci, protože např. v případě konstrukce "zmínil se o tom XX" by to podle významu naopak muselo zůstat jako koreference a byl by v tom chaos. Možná by se to ale dalo rozlišovat substitučním testem -- v případě, že jde zájmeno "to" nahradit spojením "tuto větu", je to ANAF, pokud ne (jako třeba u toho zmínil se -- nejde říct "zmínil se o této větě"), je to koreference...  **AN:** Souhlasim s Jirkou - ne vsude, ale podle smyslu pokud to patri pod ANAF, tak bych to opravovala. **RO** Moc se mi to nezdá, resp. není podle mě tak jednoznačné, že to zájmeno odkazuje na výpověď o situaci, a nikoli na situaci samu. Např. ten vyšetřovatel z případu určitě prostě informoval o situaci, aniž použil přesně danou větu (takže ani pro "říct" ten test moc nesedí. Jako metajazyk bych to snad bral jen v případě, že by předchozí věta byla v uvozovkách jako citace.) Takhle bychom jenom zkomplikovali shodu, která je teď automatická: co kdyby tam místo "řekl to" bylo "prohlásil to", "oznámil to", "sdělil to", "zmínil se o tom", "naznačil to"? Těžko bychom se ve všech případech shodli. Já bych tenhle typ do ANAFu nedával, podle mě je tam vždy nějaký odkaz k situaci samé. **AN:** mas pravdu, tim se to moc komplikuje. Tak ten pripad s kuchynskym nozem zustane viset jako problem, ale snad se to casto neopakuje.|   +M | 
 ^ AN 6.3. | vysledky schuzky 5.3.| **1)** dohodli jsme se neanotovat casti pojmenovanych entit, pokud samy nejsou pojmenovana entita (Oddeleni pro vyzkum ... vyzkum, ministerstvo zemedelstvi - zemedelstvi, ale anotovat ustavni soud CR - CR) **2)** musim presne vymezit typ PART - jako ze anotujeme pokoj - strop, Nemecko - Berlin, mesto - ulice, ale ne mesto - dum, mesto - muzeum. K tomu by se hodil nejaky dobry otazkovy test. **RO**: co třeba otázka "je to část území?" - to by zařadilo stát-město; stát-region; město-ulice; např. oblast-jezero apod., ne už město-dům. Ale možná to nestačí na vyloučení případu město-parkoviště, pokud to nechceme. **3)** zavedli jsme skupinu ANAF pro nekoreferencni anaforicky vztah **4)** //technicke pozadavkyA//: "predanotace stejnych lemmat v danem souboru" - jde o to, ze nechceme redanotovat vsechna stejna lemmata toho mazani sipek bude s velkou pravdepodobnosti vic, nez jejich zavedeni. Chceme ale toto: Pokud otevreme soubor a vidime, ze vsechny (valna vetsina) uzly s danym stejnym lemmatem jsou koreferencni, tak je muzeme propojit jednim krokem. Treba v jednom souboru spojit vsechny uzly s lemmatem "dite", nebo "Durych". **5)** //technicke pozadavkyB//: Dalsi vec se tyka zbarevneni bridgingu. Momentalne mame, ze se barene ukazuji uzly, ktere jsou spojene s oznacenym a dale retezove nahoru. Chteli bychom to trochu zmenit. U textove koreference by to zustalo jak to je. U bridging by se zmenilo to, ze by se neukazal cely retezec, ale jenom ten uzel, ktery je propojen bridgingem s danym uzlem. To je to zuzeni. Na druhou stranu chteli bychom k tomu taky neco pridat, a to aby se blede modre oznacovaly vsechny bridgingy napojene na dany textove koreferencni retezec (ale primo, ne retezove). **6)**  odkaz typu segm neni vzdy koreferencni. Napr. cely text a pak "podobne problemy resime..." jeste neco?| --> M|  ^ AN 6.3. | vysledky schuzky 5.3.| **1)** dohodli jsme se neanotovat casti pojmenovanych entit, pokud samy nejsou pojmenovana entita (Oddeleni pro vyzkum ... vyzkum, ministerstvo zemedelstvi - zemedelstvi, ale anotovat ustavni soud CR - CR) **2)** musim presne vymezit typ PART - jako ze anotujeme pokoj - strop, Nemecko - Berlin, mesto - ulice, ale ne mesto - dum, mesto - muzeum. K tomu by se hodil nejaky dobry otazkovy test. **RO**: co třeba otázka "je to část území?" - to by zařadilo stát-město; stát-region; město-ulice; např. oblast-jezero apod., ne už město-dům. Ale možná to nestačí na vyloučení případu město-parkoviště, pokud to nechceme. **3)** zavedli jsme skupinu ANAF pro nekoreferencni anaforicky vztah **4)** //technicke pozadavkyA//: "predanotace stejnych lemmat v danem souboru" - jde o to, ze nechceme redanotovat vsechna stejna lemmata toho mazani sipek bude s velkou pravdepodobnosti vic, nez jejich zavedeni. Chceme ale toto: Pokud otevreme soubor a vidime, ze vsechny (valna vetsina) uzly s danym stejnym lemmatem jsou koreferencni, tak je muzeme propojit jednim krokem. Treba v jednom souboru spojit vsechny uzly s lemmatem "dite", nebo "Durych". **5)** //technicke pozadavkyB//: Dalsi vec se tyka zbarevneni bridgingu. Momentalne mame, ze se barene ukazuji uzly, ktere jsou spojene s oznacenym a dale retezove nahoru. Chteli bychom to trochu zmenit. U textove koreference by to zustalo jak to je. U bridging by se zmenilo to, ze by se neukazal cely retezec, ale jenom ten uzel, ktery je propojen bridgingem s danym uzlem. To je to zuzeni. Na druhou stranu chteli bychom k tomu taky neco pridat, a to aby se blede modre oznacovaly vsechny bridgingy napojene na dany textove koreferencni retezec (ale primo, ne retezove). **6)**  odkaz typu segm neni vzdy koreferencni. Napr. cely text a pak "podobne problemy resime..." jeste neco?| --> M| 
 ^ AN 28.2. | casti pojmenovanych entit| jak na to ted koukam, asi mame zavst pravidlo, neanotovat casti pojmenovanych entit v samostatnych koreferencnich retezcich. Snad to usnadni praci. Jeste to upresnim a probereme to nekdy na schuzce.| --> M|  ^ AN 28.2. | casti pojmenovanych entit| jak na to ted koukam, asi mame zavst pravidlo, neanotovat casti pojmenovanych entit v samostatnych koreferencnich retezcich. Snad to usnadni praci. Jeste to upresnim a probereme to nekdy na schuzce.| --> M| 

[ Back to the navigation ] [ Back to the content ]