Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
anotace-rozsirene-koreference [2008/11/21 12:58] ufal |
anotace-rozsirene-koreference [2009/03/16 10:31] mirovsky |
||
---|---|---|---|
Line 9: | Line 9: | ||
- | ===== Dokumenty ===== | ||
- | * Manuálek k anotaci rozšířené koreference (stručná verze): [[http:// | ||
- | * Manuálek k anotaci rozšířené koreference (podrobná neupravená verze): | ||
- | [[http:// | ||
- | * Otázky - odpovědi - diskuze (do 6.11.): [[http:// | ||
- | * Koreference NP s abstraktním významem: [[http:// | ||
- | ===== Anotátoři ===== | ||
- | * **JK**: Jan Křiván | ||
- | * **RO**: Radek Ocelák | ||
- | * **JP**: Jiří Pergler | ||
- | * **AN**: Аня Hедолужко | ||
Line 30: | Line 19: | ||
+ | ===== Dokumenty ===== | ||
+ | * Manuálek k anotaci rozšířené koreference (stručná verze): [[http:// | ||
+ | * Manuálek k anotaci rozšířené koreference (podrobná neupravená verze, 6.12.): | ||
+ | * Koreference NP s abstraktním významem (**verze 6.12.**): [[http:// | ||
+ | * // | ||
+ | * Mezianotatorska neshoda [[http:// | ||
+ | |||
Line 37: | Line 33: | ||
+ | ===== Anotátoři ===== | ||
+ | * **JK**: * Jan Křivan | ||
+ | * **RO**: Radek Ocelák | ||
+ | * **JP**: Jiří Pergler | ||
+ | * **AN**: Аня Hедолужко | ||
Line 43: | Line 44: | ||
- | ===== Diskuze ===== | ||
- | | ^ problém | ||
- | ^ schůzka_6.11 | ||
- | ^ schůzka_6.11 | ||
- | ^ schůzka_6.11 | ||
- | ^ dotaz RO | ||
- | ^ dotaz JP | ||
- | ===== Data ===== | ||
Line 59: | Line 52: | ||
+ | ===== Diskuze ===== | ||
+ | [[Diskuze]] na samostatné stránce. | ||
+ | ===== Data ===== | ||
+ | [[Přehled o anotovaných datech]] na samostatné stránce. | ||
- | ==== Train-1 ==== | ||
- | |||
- | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ | ||
- | | data_20081016_Anja.zip | 28 | 479 | 7190 | AN | 16.10.2008 | - | cmpr9410_001 - lnd94103_106 | | ||
- | | data_20081016_Radek_Ocelak.zip | 31 | 498 | 8922 | RO | 16.10.2008 | 10.11.2008 | lnd94103_116 - ln94202_75 | | ||
- | | data_20081016_Jan_Krivan.zip | 31 | 496 | 9305 | JK | 16.10.2008 | - | ln94202_84 - ln94204_78 | | ||
- | | data_20081016_Jiri_Pergler.zip | 24 | 246 | 4068 | JP | 16.10.2008 | 6.11.2008 | ln94204_87 - ln94206_29 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | 585 | AN | 5.11.2008 | 10.11.2008 | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | 585 | RO | 5.11.2008 | 10.11.2008 | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | 585 | JK | 5.11.2008 | - | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081105_test_shody.zip | 3 | 41 | 585 | JP | 5.11.2008 | 16.11.2008 | ln94206_38, ln94206_56, mf920922_044 | | ||
- | | data_20081106_Radek_Ocelak.zip | 41 | 816 | 13178 | RO | 6.11.2008 | - | ln94206_47, ln94206_65 - ln94209_50 | | ||
- | | data_20081106_Jan_Krivan.zip | 63 | 801 | 14566 | JK | 6.11.2008 | - | ln94209_6 - ln95047_051 | | ||
- | | data_20081106_Jiri_Pergler.zip | 19 | 404 | 6862 | JP | 6.11.2008 | - | ln95047_061 - ln95048_102 | | ||
===== Zajimavé/ | ===== Zajimavé/ | ||
+ | **JP: K nejasné hranici mezi koreferencí a bridgingem -- posloupnost " | ||
+ | //(1) V podmínkách ČR je však možné, aby na veřejné vodovody, které jsou schopny zajistit nezávadnou a kontrolovanou pitnou __vodu__, bylo připojeno 92 až 95 procent obyvatel. | ||
+ | (2) Pražané snížili spotřebu __vody__. | ||
+ | (3) Spotřeba pitné __vody__ v Praze výrazně klesla, nyní je na úrovni let 1982 a 1983. | ||
+ | (4) Pro Prahu __ji__ vyrábí vodárny Želivka, Káraný a Podolí. | ||
+ | (5) Největší podíl (60 procent) má vodárna využívající __vodu__ z vodního díla Želivka.// | ||
+ | Vodu v první větě jsem chápal jako generickou. Otázka je, jak je to ve druhé a třetí větě -- logicky jde jakoby jen o určitou " | ||
+ | |||
+ | **JP: Příklad na vztah SET--SUB u uzlu s nespecifickou a uzlu se specifickou referencí: | ||
+ | //O významu přímých investic se můžeme přesvědčit z prvních praktických příkladů. Nejde jenom o samotný příliv peněz, ale také o vytváření pracovních __příležitostí__, | ||
+ | |||
+ | **AN:** posloupnost " | ||
+ | (1) Ačkoli neexistují žádné spolehlivé statistiky , znalci zaregistrovali nárůst zatčení v souvislosti s __heroinem__ a hospitalizací ze stejného důvodu . | ||
+ | (2) Jen za rok 1992 stoupla v New Yorku " návštěvnost " oddělení pro zvláštní případy o 34 % a uvězněno bylo o 16 % víc překupníků a pašeráků __této drogy__ . | ||
+ | (3) Je jasné , že podmínky pro vznik heroinové epidemie jsou až nebezpečně příznivé , podobně jako tomu bylo v Americe beatnické éry . | ||
+ | (4) Od té doby ( tj . přibližně po třicet let ) byl černý trh __tímto opiátem__ přehlcován , a tak __jeho__ cena logicky výrazně poklesla . | ||
+ | (5) Nyní stojí skoro stejně jako crack , který patří do levnějších kategorií středně těžkých drog a je právě velice v módě . | ||
+ | (6) Současný __heroin__ je také mnohem čistší a jemnější než dříve . | ||
+ | (7) V běžném __vzorku__ sedmdesátých let byla pouze 3 - 4 procenta čisté __suroviny__ . | ||
+ | (8) Nyní jsou k dostání __balíčky__ obsahující až 80 procent čistého __heroinu__ . | ||
+ | (9) __Droga__ je tedy tak účinná , že ten , kdo __ji__ užívá , se snadno dostane do " pohody " kouřením nebo šňupáním . | ||
+ | |||
+ | Problematické věty jsou hlavně (7) a (8), kde nevím, jak jde propojit vzorky s heroinem, a pak k nim dále připojit surovinu, balíčky, čistý heroin a drogu v (9). V anotaci jsem to nakonec co nejvíc propojila na úkor skutečné koreferenci. | ||
+ | |||
+ | |||
**RO:** "Jak se vám zamlouvá Pragobanka Cup?" "V tomhle termínu takováhle akce chyběla." | **RO:** "Jak se vám zamlouvá Pragobanka Cup?" "V tomhle termínu takováhle akce chyběla." | ||
Byl bych pro to, označovat " | Byl bych pro to, označovat " | ||
Line 93: | Line 101: | ||
**JP:** "Kdo volil Hnutí za demokratické Slovensko (...), volil Moskvu..." | **JP:** "Kdo volil Hnutí za demokratické Slovensko (...), volil Moskvu..." | ||
+ | |||
+ | |||
+ | **RO:** " | ||
+ | |||
+ | |||
+ | |||
- | ===== Zatím nevyřešené poznámky k bridging rozšíření pro TrEd (náměty na zlepšení) ===== | ||
- | Honza Krivan, 8.10.2008 | + | ===== Rozšíření TrEdu ===== |
- | 1. Neni mozne vypnout funkci, kdy pri vybrani slova v kontextovem seznamu vet se strom vycentruje na toto slovo/uzel? Mne napriklad velmi vyhovuje, kdyz si nastavim okoli se stromy (pritom nejsou videt cele), ale tohle centrovani velmi zdrzuje. Mnohem vic by se mi libilo, kdyby se uzel jen zazlutil | + | Pro TrEd existuje rozšíření pro anotaci rozšířené textové koreference |
- | 2. Podobna vec v hornim okne: obcas zacne program nesmyslne pohybovat s kontextovym seznamem vet: okno zacne rolovat, vybrane slovo se objevi bud na spodu okna, nebo naopak uplne nahore mimo zorne pole... To cele zpusobi jen jedno moje kliknuti na slovo. Uz mi kvuli tomu dokonce spadl i cely program. Idealni by bylo, kdyby se lista vubec nepohybovala a reagovala jen na moje manualni pokyny. | + | [[Rozsireni Tredu|Rozšíření TrEdu]] - na samostatné stránce |