Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
projekt-anotace-diskurzu [2008/12/10 12:12] anotator |
projekt-anotace-diskurzu [2009/03/16 11:11] ptacek |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Projekt anotace diskurzu ====== | + | ====== Projekt anotace diskurzu |
+ | |||
+ | Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: [[internal: | ||
- | Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https:// | ||
==== Cíle projektu ==== | ==== Cíle projektu ==== | ||
- | Anotace diskurzu | + | Anotace diskurzu |
- | Cílem je doplnit anotaci rozšířené koreference v PDT o další textové vztahy, které se podílejí na celkové koherenci textu. Jsou to zejména vztahy mezi větami (mezi stromy), a tudíž je TR zatím nezachycuje. TR pouze signalizuje některé z nich funktorem PREC, který ovšem postrádá bližší sémantickou specifikaci. Anotace nadvětných vztahů bude vycházet z hierarchické soustavy diskurzních vztahů vypracované Š. Zikánovou (Zikánová 2007) na základě soustavy vytvořené pro Penn Discourse TreeBank. Podobně jako v PDTB budeme postupovat od anotace konektorů (funktor PREC a další lexémy s touto funkcí, které ale mají v TR jiné funktory). V první fázi se nebudeme zabývat koordinačními vztahy uvnitř věty (uzly s nodetype=coap), | + | Cílem je doplnit anotaci rozšířené koreference v PDT o další textové vztahy, které se podílejí na celkové koherenci textu. Jsou to zejména vztahy mezi větami (mezi stromy), a tudíž je TR zatím nezachycuje. TR pouze signalizuje některé z nich funktorem PREC, který ovšem postrádá bližší sémantickou specifikaci. Anotace nadvětných vztahů bude vycházet z hierarchické soustavy diskurzních vztahů vypracované Š. Zikánovou (Zikánová 2007) na základě soustavy vytvořené pro Penn Discourse TreeBank. Podobně jako v PDTB budeme postupovat od anotace konektorů (funktor PREC a další lexémy s touto funkcí, které ale mají v TR jiné funktory). V první fázi se nebudeme zabývat koordinačními vztahy uvnitř věty (uzly s nodetype=coap), |
V druhé fázi bychom se vrátili zpět „dovnitř věty“, kde vidíme tyto dílčí úkoly: | V druhé fázi bychom se vrátili zpět „dovnitř věty“, kde vidíme tyto dílčí úkoly: | ||
Line 17: | Line 18: | ||
- | ==== Kdo se v tom angažuje | + | |
+ | ==== Na projektu | ||
lingvisticky: | lingvisticky: | ||
Line 36: | Line 38: | ||
1letý GAUK Pavla Češky na technickou podporu anotace diskurzu | 1letý GAUK Pavla Češky na technickou podporu anotace diskurzu | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Anotační poznámky ==== | ||
+ | **[[projekt-anotace-diskurzu: | ||
+ | nové poznámky píšeme vždy nahoru, staré nemažeme | ||
==== Zápisy ze schůzek ==== | ==== Zápisy ze schůzek ==== | ||
Line 44: | Line 53: | ||
zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} | zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} | ||
zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | ||
+ | zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}} | ||
+ | |||
Line 57: | Line 68: | ||
- Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | ||
- Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | ||
+ | - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{tahak-typy-vztahu.doc|}} | ||
==== Aktuálně ==== | ==== Aktuálně ==== | ||
- | - domyslet technické řešení | + | (LM, 2.3.2009) |
- | - převést to do TrEdu | + | - další úpravy tredu pro anotaci v kontextu discourse |
+ | - úpravy setu sémantických textových vztahů | ||
+ | - první cvičná data pro měření shody | ||
+ | - pondělní seminář 9.3. - přehled nejnovější práce | ||
+ | |||
+ | (LM, 5.1.2009) | ||
+ | - první verze tredího kontextu discourse se zabíhá a zkouší | ||
+ | - konverze dat pro anotaci | ||
- oanotovat vybrané konektory: | - oanotovat vybrané konektory: | ||
**však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, | **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, | ||
Line 69: | Line 88: | ||
- první zkoumaná skupina vztahů (z PDTB): **contingency** | - první zkoumaná skupina vztahů (z PDTB): **contingency** | ||
- | **- navržená tabulka vlastností konektorů pro anotaci:** | + | ==== Anotační tabulka ==== |
+ | |||
+ | ** navržená tabulka vlastností | ||
+ | |||
+ | **1. typ vztahu** (r: sarciny zkratky* //komentar bez diakritiky// | ||
+ | **2. rozsah argumentů** (1: PAR* //nespojita vsuvka s RHEM//) | ||
+ | **3. konektor** (pokud je v textu) | ||
+ | |||
+ | | ||
+ | vazba na pozici - větná, relativní (**pozice: | ||
+ | | ||
+ | | ||
+ | | ||
+ | odkaz do stejného stromu (**ss:**) | ||
+ | | ||
- | - typ vztahu | ||
- | - nahraditelnost | ||
- | - vazba na pozici (větná, relativní) | ||
- | - souvýskyt (s možnými konektory, jiný souvýskyt) | ||
- | - negace | ||
- | - morfologické zvláštnosti okolí | ||
- | - odkaz do stejného stromu | ||
- | - ostatní | ||
Line 84: | Line 109: | ||
==== Spolupráce ==== | ==== Spolupráce ==== | ||
- výrazná spolupráce s anotací rozšířené textové koreference (Anja) | - výrazná spolupráce s anotací rozšířené textové koreference (Anja) | ||
- | - anotace dialogu pro Companions (Silvie | + | - anotace dialogu pro Companions (Silvie) |
- technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | ||
Line 91: | Line 116: | ||
+ | ==== Rozšíření pro Tred pro anotaci diskurzu ==== | ||
+ | === 20081217 (JM): === | ||
+ | Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Původní záměr byl, že se budou nadále vyvíjet jako jedno rozšíření, | ||
+ | === Jednoduchý návod k instalaci a použití: === | ||
+ | ==Instalace: | ||
+ | Tred instalujte ze stránky http:// | ||
+ | Nainstalujte rozšíření Discourse Annotation (Session -> Manage Extensions) | ||
+ | |||
+ | ==Ovládání zobrazení: | ||
+ | Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami: | ||
+ | Alt+b: bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, | ||
+ | Alt+d: pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) | ||
+ | Alt+f: full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny | ||
+ | |||
+ | Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto: | ||
+ | Ctrl+b: přepne zobrazení bridging anafory | ||
+ | Ctrl+g: přepne zobrazení gramatické koreference | ||
+ | Ctrl+t: přepne zobrazení textové koreference | ||
+ | Ctrl+d: přepne zobrazení čistě diskurzních šipek | ||
+ | |||
+ | Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách. | ||
+ | |||
+ | ==Editace diskurzních šipek:== | ||
+ | Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. | ||
+ | mezera - označí budoucí cílový uzel diskurzní šipky | ||
+ | f (forget) - ruční zapomenutí dříve označeného cílového uzlu (není nutné takto ručně zapomínat) | ||
+ | d (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu | ||
+ | c (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
+ | r (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
+ | x - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
+ | Pro úplnost: t vloží textovou koreferenci, | ||
+ | ==== Interní poznámky ==== | ||
+ | pouze pro přihlášené [[: | ||