Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
projekt-anotace-diskurzu [2008/11/11 16:24] anotator |
projekt-anotace-diskurzu [2022/01/17 15:43] (current) ufal |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Projekt anotace diskurzu ====== | + | ====== Projekt anotace diskurzu |
- | Doplňující aktuální informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https:// | ||
- | ==== Předběžné poznámky a materiály k projektu ==== | + | ==== Cíle projektu ==== |
- | Anotace diskurzu | + | Anotace diskurzu |
+ | Cílem je doplnit anotaci rozšířené koreference v PDT o další textové vztahy, které se podílejí na celkové koherenci textu. Jsou to zejména vztahy mezi větami (mezi stromy), a tudíž je TR zatím nezachycuje. TR pouze signalizuje některé z nich funktorem PREC, který ovšem postrádá bližší sémantickou specifikaci. Anotace nadvětných vztahů bude vycházet z hierarchické soustavy diskurzních vztahů vypracované Š. Zikánovou (Zikánová 2007) na základě soustavy vytvořené pro Penn Discourse TreeBank. Podobně jako v PDTB budeme postupovat od anotace konektorů (funktor PREC a další lexémy s touto funkcí, které ale mají v TR jiné funktory). V první fázi se nebudeme zabývat koordinačními vztahy uvnitř věty (uzly s nodetype=coap), | ||
- | ==== Kdo se v tom angažuje ==== | + | V druhé fázi bychom |
+ | - zpracování kategorie CM (conjuction modifier) a tedy víceslovných spojovacích výrazů | ||
+ | - sémantické rozpracování koordinačního vztahu APPS (apozice), sémantické zpracování nepravých vedlejších vět a vztah vsuvky (PAR) ke větě, do níž je vsunuta | ||
+ | Z mezivětných vztahů bychom doplnili: | ||
+ | - propojení přímé řeči o více větách (stromech) | ||
+ | - spojení všech parcelací | ||
- | prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zdeněk Žabokrtský, | ||
- | ==== Zadané práce ==== | ||
- | LM + ZB: disertace, (ZB na FF :-)) | ||
- | ==== Granty ==== | ||
- | Čeká se na schválení GAČRu paní profesorky Hajičové a Šárky Zikánové | ||
- | Možnost mezinárodního grantu v návaznosti na prof. Joshiho a Penn Discourse Treebank | ||
Line 20: | Line 19: | ||
+ | ==== Na projektu se podílejí ==== | ||
+ | lingvisticky: | ||
+ | technicky: Jirka Mírovský (dříve i Petr Pajas, Zdeněk Žabokrtský) | ||
+ | anotátoři: | ||
- | ==== Materiály ==== | + | **PJ** Pavlína Jínová |
+ | **VP** Veronika Pavlíková | ||
+ | **MR** Magdaléna Rysová | ||
+ | **JZ** Jana Zdeňková | ||
+ | (dříve i **HF** Helena Filipová) | ||
- | Poznámky + zápisy z “diskurzních sezení” | ||
- | {{podklady_11-2-2008.pdf|podklady_schuzka 11-02-2008}} | ||
- | {{zapis-18-02-2008.pdf|zapis_schuzka 18-02-2008}} | ||
- | Anotace diskurzu v PDT – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ | ||
- | Odkaz na [[http:// | ||
- | MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} | ||
- | {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH | ||
Line 38: | Line 38: | ||
- | ==== Spolupráce ==== | ||
- | - výrazná kooperace s anotací TFA a koreference (rozvedení anotace textové koreference) | ||
- | - anotace dialogu pro Companions (Silvie) | ||
- | - technicky: vytvoření anotačního prostředí – kontext “megatree” v TrEdu, první hrubou verzi už dal dohromady Pepa Toman: | ||
- | ukázka megastromu: | ||
- | {{megastrom2.png|}} | ||
+ | ==== Průběh projektu ==== | ||
+ | [[projekt-anotace-diskurzu: | ||
- | ==== Zápisy ze schůzek ==== | + | ==== VŠE K ANOTACI ==== |
- | zápis 07-11-2008 {{zapis-07-11-2008.doc|}} | + | |
+ | [[: | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Různé materiály | ||
+ | - Odkaz na [[http:// | ||
+ | - [[instalace_PDTB|Instalace prohlížeče pro Penn Discourse Treebank]] | ||
+ | - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http:// | ||
+ | |http:// | ||
+ | - MANUÁL PDTB 2.0 ke stáhnutí | ||
+ | - Seznamy konektorů od Zuzky: | ||
+ | {{internal: | ||
+ | {{internal: | ||
+ | {{internal: | ||
+ | - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal: | ||
+ | - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal: | ||
+ | - Základní bibliografie k podklasifikaci textovych vztahů{{internal: | ||
+ | |||
+ | ==== Bylo ==== | ||
+ | (LM, 2.3.2009) | ||
+ | - další úpravy tredu pro anotaci v kontextu discourse | ||
+ | - úpravy setu sémantických textových vztahů | ||
+ | - první cvičná data pro měření shody | ||
+ | - pondělní seminář 9.3. - přehled nejnovější práce | ||
+ | |||
+ | (LM, 5.1.2009) | ||
+ | - první verze tredího kontextu discourse se zabíhá a zkouší | ||
+ | - konverze dat pro anotaci | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Spolupráce ==== | ||
+ | - výrazná spolupráce s anotací rozšířené textové koreference (Anja) | ||
+ | - anotace dialogu pro Companions (Silvie) | ||
+ | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | ||
+ | |||
+ | |||
+ | ==== Rozšíření TrEdu pro anotaci diskurzu ==== | ||
+ | |||
+ | Tred používá k anotaci diskurzu rozšíření, | ||
+ | [[projekt-anotace-diskurzu: | ||
==== Bibliografie k diskurzu ==== | ==== Bibliografie k diskurzu ==== | ||
Line 111: | Line 170: | ||
Zikánová, Š. (2007). Possibilities of Discourse Annotation in Prague Dependency Treebank (Based on the Penn Discourse Treebank Annotation). Technical report. Institute of Formal and Applied Linguistics, | Zikánová, Š. (2007). Possibilities of Discourse Annotation in Prague Dependency Treebank (Based on the Penn Discourse Treebank Annotation). Technical report. Institute of Formal and Applied Linguistics, | ||
- | |||
- |