Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
rozsireni-tredu [2009/03/16 10:07] mirovsky |
rozsireni-tredu [2009/05/11 13:13] mirovsky |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Rozšíření TrEdu pro anotaci rozšířené textové koreference a bridging anaphory ====== | ====== Rozšíření TrEdu pro anotaci rozšířené textové koreference a bridging anaphory ====== | ||
- | Pro TrEd existuje rozšíření bridging, nainstalovat lze přes Session→Manage Extensions. | + | Pro TrEd existuje rozšíření |
- | (zdroj: / | + | |
- | Umožňuje otevřít rozšířené t-soubory a editovat a zobrazit koreferenční šipky a bridging šipky. Nastavuje zobrazení kontextových vět a v nich zvýrazňuje prvky koreferenčních řetízků, ve kterých se účastní aktuální slovo (a něco navíc). Rovněž podtrhuje slova se stejným lemmatem jako má aktuální slovo. | + | |
+ | Umožňuje otevřít rozšířené t-soubory a editovat a zobrazit koreferenční šipky a bridging šipky. Nastavuje zobrazení kontextových vět a zvýrazňuje v nich některá slova. | ||
+ | |||
+ | Při vytvoření textové koreferenční šipky mezi uzly, které (jeden z nich) už jsou součástí koreferenčního řetězce, se snaží zařadit nové uzly k již existujícímu řetězci tak, aby opět vznikl souvislý zprava doleva vedoucí koreferenční řetězec. Rovněž při smazání šipky z řetězce se snaží řetězec zachovat propojený. | ||
+ | |||
+ | Ve větách jsou zvýrazněna tato slova: | ||
+ | * slova s t_lemmatem shodným s t_lemmatem aktuálního uzlu jsou podtržena | ||
+ | * slova, která jsou součástí koreferenčního řetízku vedoucího skrz aktuální uzel, jsou zvýrazněna tmavě modře (textová koreference) nebo červenohnědě (gramatická koreference) | ||
+ | * slova, která jsou s koreferenčním řetízkem vedoucím skrz aktuální uzel (či přímo s aktuálním uzlem) spojena jednou bridging šipkou, jsou zvýrazněna světle modře | ||
+ | |||
+ | |||
+ | |||
+ | ===== Instalace ===== | ||
+ | Tred instalujte ze stránky [[http:// | ||
+ | Nainstalujte rozšíření **bridging** (Session -> Manage Extensions) | ||
===== Ovládání ===== | ===== Ovládání ===== | ||
- | Mezera | + | Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. |
- | **t** - vytvoří koreferenční šipku od aktuálního uzlu k zapamatovanému uzlu; zobrazí okno pro výběr typu koreference | + | **mezera** |
- | **b** - vytvoří bridging šipku od aktuálního uzlu k zapamatovanému uzlu; zobrazí okno pro výběr typu bridging šipky | + | **f (forget)** - zapomene dříve zapamatovaný uzel (není nutno ručně zapomínat - zapomene se při vybrání jiného či při vytvoření šipky) |
- | **r** - přetypuje | + | **t (textual coreference)** - vytvoří koreferenční šipku od aktuálního uzlu k zapamatovanému uzlu; zobrazí okno pro výběr typu koreference |
- | **x** - odstraní | + | **b (bridging anaphora)** - vytvoří bridging šipku od aktuálního uzlu k zapamatovanému uzlu; zobrazí okno pro výběr typu bridging šipky |
+ | **r (re-type)** - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek | ||
+ | **x** - smazání | ||
**Ctrl+t** - v celém souboru vytvoří koreferenční řetěz mezi slovy, která mají stejné t_lemma jako aktuální uzel | **Ctrl+t** - v celém souboru vytvoří koreferenční řetěz mezi slovy, která mají stejné t_lemma jako aktuální uzel | ||
- | ===== Zatím nevyřešené náměty na vylepšení ===== | ||
- | Honza Krivan, 8.10.2008 | ||
- | 1. Neni mozne vypnout funkci, kdy pri vybrani slova v kontextovem seznamu vet se strom vycentruje na toto slovo/uzel? Mne napriklad velmi vyhovuje, kdyz si nastavim okoli se stromy (pritom nejsou videt cele), ale tohle centrovani velmi zdrzuje. Mnohem vic by se mi libilo, kdyby se uzel jen zazlutil a sam bych si mohl posunout rolovaci listou. Idealne kdyby centrovani fungovalo jen v okamziku, kdy strom s vybranym slovem jeste neni vubec nacten. | ||
- | 2. Podobna vec v hornim okne: obcas zacne program nesmyslne pohybovat | + | |
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Technické problémy s aktuální verzi anotačního nástroje ===== | ||
+ | |||
+ | | ^ problém | ||
+ | ^ JP, 7.5. | Toto automatické propojování totiž ne vždy úplně funguje. V případě, že chci jeden uzel zapojit do již souvislého řetězce (tj. např. mám v tomto pořadí uzly A, B, C, přičemž uzly A, C jsou spojené; když spojím B s A, tak se šipka vedoucí z C automaticky přesměruje z A na B), tak není problém. Problém ale je, když chci navzájem propojit dva už existující delší řetězce - nevím, jak přesně to funguje, ale nevytvoří se jeden souvislý řetězec, nýbrž se tam někde objeví nějaké rozdvojení. | | | | ||
+ | ^ AN, 7.5. | mazani bridging sipky vzdy hlasi chybu typu " | ||
+ | ^ AN, 7.5. | blede modre zaberveni bridgingu neni uplne - nejsou zabarvene vsechny uzly, ktere jsou spojene bridging-vztahem s danym koreferencnim retezcem| Anja najde a pošle id uzlu | | | ||
+ | ^ AN, 7.5. | povrchovy slovosled ne vzdy odpovida poradi uzlu ve strome. Koreferenci delame podle povrchoveho slovosledu. Pokud je ve stromu jiny, sipka se udela obracene (ve strome vede doprava) a kvuli tomu pak dalsi koreferencne sipka nevede na nej, ale na predchazejici uzel. Chtelo | ||
+ | |||
+ | |||
+ | ===== Chceme ještě udělat===== | ||
+ | | ^ problém | ||
+ | ^ AN, 7.5. | zvyraznit slova //zdejsi, mistni, tamni// aby se na to pri anotaci nezapominalo| | | | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== K opravě u seznamu pojmenovaných entit ===== | ||
+ | |||
+ | | ^co opravit | ||
+ | ^ | **Rus - Rusko** pokud je zadano jako koreferencni, | ||
+ | ^ | chybi **Maroko** | | |