Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
rozsireni-tredu [2009/03/16 10:04] mirovsky vytvořeno |
rozsireni-tredu [2012/06/14 10:47] (current) ufal |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Rozšíření TrEdu pro anotaci rozšířené textové koreference a bridging anaphory ====== | ====== Rozšíření TrEdu pro anotaci rozšířené textové koreference a bridging anaphory ====== | ||
- | Pro TrEd existuje rozšíření bridging, nainstalovat lze přes Session→Manage Extensions. | + | Pro TrEd existuje rozšíření |
- | (zdroj: / | + | |
- | Umožňuje otevřít rozšířené t-soubory a editovat a zobrazit koreferenční šipky a bridging šipky. Nastavuje zobrazení kontextových vět a v nich zvýrazňuje | + | Umožňuje otevřít rozšířené t-soubory a editovat a zobrazit koreferenční šipky a bridging šipky. Nastavuje zobrazení kontextových vět a zvýrazňuje |
+ | |||
+ | Při vytvoření textové | ||
+ | |||
+ | Ve větách jsou zvýrazněna tato slova: | ||
+ | * slova s t_lemmatem shodným s t_lemmatem aktuálního uzlu jsou podtržena | ||
+ | * slova, která jsou součástí koreferenčního řetízku vedoucího skrz aktuální | ||
+ | * slova, která jsou s koreferenčním řetízkem vedoucím skrz aktuální uzel (či přímo s aktuálním uzlem) spojena jednou bridging šipkou, jsou zvýrazněna světle modře | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Instalace ===== | ||
+ | Tred instalujte ze stránky [[http:// | ||
+ | Nainstalujte rozšíření **bridging** (Session -> Manage Extensions); | ||
+ | |||
+ | |||
+ | |||
+ | |||
===== Ovládání ===== | ===== Ovládání ===== | ||
- | Mezera | + | Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. |
- | t - vytvoří koreferenční šipku od aktuálního uzlu k zapamatovanému uzlu; zobrazí okno pro výběr typu koreference | + | **mezera** |
- | b - vytvoří bridging šipku od aktuálního uzlu k zapamatovanému uzlu; zobrazí okno pro výběr typu bridging šipky | + | **f (forget)** - zapomene dříve zapamatovaný uzel (není nutno ručně zapomínat - zapomene se při vybrání jiného či při vytvoření šipky) |
- | r - přetypuje | + | **t (textual coreference)** |
- | x - odstraní | + | **v** - vytvoří/ |
- | Ctrl+t - v celém souboru vytvoří koreferenční řetěz mezi slovy, která mají stejné t_lemma jako aktuální uzel | + | **b (bridging anaphora)** |
+ | **Ctrl+levé tlačítko myši na uzlu či slově ve větách** - zapamatuje si uzel (jako mezera), ale nezmění se aktuální uzel; zároveň se k takto zapamatovanému uzlu vytvoří šipka textové koreference - zobrazí se dialogové okno pro výběr typu | ||
+ | **Shift+levé tlačítko myši na uzlu či slově ve větách** | ||
+ | **r (re-type)** - změna typu šipky | ||
+ | **o** - změna zdroje (atributu src) šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky; naposledy vložená hodnota se použije u dalších vytvářených šipek | ||
+ | **x** - smazání | ||
+ | **Ctrl+h** - v celém souboru vytvoří koreferenční řetěz mezi slovy, která mají stejné t_lemma jako aktuální uzel | ||
+ | **e** - vypne/zapne zobrazení kontextových stromů | ||
+ | **E** - přepíná množství zobrazovaných kontextových vět (0, 5, 20, 100) | ||
+ | **n** - přepíná překlad vět (pokud je v datech k dispozici; žádný překlad, překlad aktuální věty, překlad všech vět) | ||
+ | **p** - zapne/vypne zvýraznění slov v textu, která se jakkoli zúčastní jakékoli textové koreference | ||
+ | **Ctrl+A** (Analytical) - zobrazí analytické stromy (zpět: **Ctrl+R** (Return)) | ||
+ | **m** - (coMment) - otevře okno pro vložení a úpravu víceřádkových komentářů šipek či přidání strukturovaného komentáře k šipce; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
+ | **c** - (add node Comment) - umožní přidat strukturovaný komentář k uzlu | ||
+ | **Alt+c** - (edit node Comment) - otevře tredí editaci strukturovaných komentářů aktuálního uzlu | ||
+ | **s** - vybere zdroj anotace (anotátora), | ||
+ | **S** (Shift+s) - skryje/ | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Technické problémy s aktuální verzi anotačního nástroje ===== | ||
+ | |||
+ | | ^ problém | ||
+ | ^ RO 26.8. | Nemohly by se koreferující uzly v textu označovat jinou barvou než tmavomodrou? | ||
+ | ^ RO 28.7. | Jiří, můžeš prosím obnovit stav, kdy po vytvoření šipky zůstával označený antecedent? Je to pohodlnější.| | ||
+ | ^ JP, 7.5. | Toto automatické propojování totiž ne vždy úplně funguje. V případě, že chci jeden uzel zapojit do již souvislého řetězce (tj. např. mám v tomto pořadí uzly A, B, C, přičemž uzly A, C jsou spojené; když spojím B s A, tak se šipka vedoucí z C automaticky přesměruje z A na B), tak není problém. Problém ale je, když chci navzájem propojit dva už existující delší řetězce - nevím, jak přesně to funguje, ale nevytvoří se jeden souvislý řetězec, nýbrž se tam někde objeví nějaké rozdvojení. | Jirka P. najde a pošle příklad | | | ||
+ | ^ AN, 7.5. | mazani bridging sipky vzdy hlasi chybu typu " | ||
+ | ^ AN, 7.5. | blede modre zaberveni bridgingu neni uplne - nejsou zabarvene vsechny uzly, ktere jsou spojene bridging-vztahem s danym koreferencnim retezcem| Anja najde a pošle id uzlu | | | ||
+ | ^ AN, 7.5. | povrchovy slovosled ne vzdy odpovida poradi uzlu ve strome. Koreferenci delame podle povrchoveho slovosledu. Pokud je ve stromu jiny, sipka se udela obracene (ve strome vede doprava) a kvuli tomu pak dalsi koreferencne sipka nevede na nej, ale na predchazejici uzel. Chtelo by se dodrzet ten retezec v pripade, kdyz povrchovy slovosled neodpovida hloubkovemu. Pokud vsak ve strome sipka vede doprava, ale i na povrchu slovo, na ktery vede sipka, je druhe v poradi, ma to zustat, jak to je (je to opravdova textova katafora)| | opraveno v novém rozšíření | | ||
+ | ^ AN, 7.5. | kliknuti na uzel v kontextovem strome nevybere novou aktualni vetu | | opraveno v novém rozšíření díky Petru Pajasovi | | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Chceme ještě udělat===== | ||
+ | | ^ problém | ||
+ | ^ AN, 7.5. | zvyraznit slova //zdejsi, mistni, tamni// aby se na to pri anotaci nezapominalo| | v novém rozšíření se píší kurzívou | | ||
+ | ^ AN, 7.5. | tlacitko na zapnuti a vypnuti kontextovych stromu (file-spec) | | " | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== K opravě u seznamu pojmenovaných entit ===== | ||
- | ===== Zatím nevyřešené náměty na vylepšení ===== | + | | ^co opravit |
+ | ^ | Tádžikistán-tádžický, | ||
+ | ^ | **Rus - Rusko** pokud je zadano jako koreferencni, | ||
+ | ^ | úplně (tj. jako substantivum i adjektivum) chybi **Maroko**, **Uzbekistán**, | ||
+ | ^ | | | | ||