Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
projekt-anotace-diskurzu [2008/11/20 16:13] ufal |
projekt-anotace-diskurzu [2008/12/17 16:52] mirovsky |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Projekt anotace diskurzu ====== | + | ====== Projekt anotace diskurzu |
- | Doplňující | + | Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https:// |
- | ==== Předběžné poznámky a materiály k projektu ==== | ||
- | Anotace diskurzu se plánuje jako součást další, “vyšší” roviny v PDT, ve které bude podrobně zpracována koreference, | ||
- | ==== Kdo se v tom angažuje | + | ==== Cíle projektu |
- | prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zdeněk Žabokrtský, Zuzka Bedřichová, Katka Veselá | + | Anotace diskurzu je planována jako součást další, “vyšší” roviny v PDT, ve které bude podrobně zpracována koreference, pojmenované entity a textové vztahy (mezipropoziční vztahy, diskurz). |
- | ==== Zadané práce ==== | + | Cílem je doplnit anotaci rozšířené koreference v PDT o další textové vztahy, které se podílejí |
- | LM + ZB: disertace, (ZB na FF :-)) | + | |
- | ==== Granty ==== | + | |
- | Čeká se na schválení GAČRu paní profesorky Hajičové | + | |
- | Možnost mezinárodního grantu | + | |
- | ==== Materiály ==== | + | V druhé fázi bychom se vrátili zpět „dovnitř věty“, kde vidíme tyto dílčí úkoly: |
+ | - zpracování kategorie CM (conjuction modifier) a tedy víceslovných spojovacích výrazů | ||
+ | - sémantické rozpracování koordinačního vztahu APPS (apozice), sémantické zpracování nepravých vedlejších vět a vztah vsuvky (PAR) ke větě, do níž je vsunuta | ||
+ | Z mezivětných vztahů bychom doplnili: | ||
+ | - propojení přímé řeči o více větách (stromech) | ||
+ | - spojení všech parcelací | ||
- | Poznámky + zápisy z “diskurzních sezení” | ||
- | {{podklady_11-2-2008.pdf|podklady_schuzka 11-02-2008}} | ||
- | {{zapis-18-02-2008.pdf|zapis_schuzka 18-02-2008}} | ||
- | Anotace diskurzu v PDT – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ | ||
- | Odkaz na [[http:// | ||
- | MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} | ||
- | {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH | ||
- | Aktuální plán postupu 20-10-2008{{diskurz-plan-1-.doc|}} | ||
- | ==== Spolupráce | + | ==== Na projektu se podílejí |
- | - výrazná kooperace s anotací TFA a koreference (rozvedení anotace textové koreference) | + | |
- | - anotace dialogu pro Companions (Silvie) | + | |
- | - technicky: vytvoření anotačního prostředí – kontext “megatree” v TrEdu, první hrubou verzi už dal dohromady Pepa Toman: | + | |
- | ukázka megastromu: | + | lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová |
- | {{megastrom2.png|}} | + | technicky: Zdeněk Žabokrtský, |
+ | ==== Zadané práce ==== | ||
+ | LM + ZB: disertace, (ZB na FF :-)) | ||
+ | ==== Plánovaná podpora projekty ==== | ||
+ | Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové | ||
+ | Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank | ||
+ | Zadané návrhy na granty (všechny nové): | ||
+ | GAUKy : | ||
+ | 3letý GAUK LM na anotaci konektorů | ||
+ | 2letý GAUK ZB na sémantiku synsémantik (na FF) | ||
+ | 1letý GAUK Pavla Češky na technickou podporu anotace diskurzu | ||
==== Zápisy ze schůzek ==== | ==== Zápisy ze schůzek ==== | ||
+ | podklady pro schůzku 11-02-2008{{podklady_11-2-2008.pdf|}} | ||
+ | zápis-18-02-2008{{zapis-18-02-2008.pdf|}} | ||
+ | aktuální plán postupu 20-10-2008{{diskurz-plan-1-.doc|}} | ||
zápis 07-11-2008 {{zapis-07-11-2008.doc|}} | zápis 07-11-2008 {{zapis-07-11-2008.doc|}} | ||
+ | zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} | ||
+ | zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | ||
+ | zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}} | ||
+ | |||
+ | ==== Další materiály ==== | ||
+ | - Anotace diskurzu v PDT – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ | ||
+ | - Odkaz na [[http:// | ||
+ | - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} | ||
+ | - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH | ||
+ | - Seznamy konektorů od Zuzky: | ||
+ | {{czech-connectives.xls|české konektory}} | ||
+ | {{czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} | ||
+ | {{konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} | ||
+ | - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | ||
+ | - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | ||
+ | |||
+ | |||
+ | ==== Aktuálně ==== | ||
+ | - domyslet technické řešení anotace diskurzu | ||
+ | - převést to do TrEdu | ||
+ | - oanotovat vybrané konektory: | ||
+ | **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, | ||
+ | | ||
+ | |||
+ | - první zkoumaný konektor: **přesto** | ||
+ | - první zkoumaná skupina vztahů (z PDTB): **contingency** | ||
+ | |||
+ | **- navržená tabulka vlastností konektorů pro anotaci:** | ||
+ | |||
+ | - typ vztahu | ||
+ | - nahraditelnost | ||
+ | - vazba na pozici (větná, relativní) | ||
+ | - souvýskyt (s možnými konektory, jiný souvýskyt) | ||
+ | - negace | ||
+ | - morfologické zvláštnosti okolí | ||
+ | - odkaz do stejného stromu | ||
+ | - ostatní | ||
+ | |||
+ | |||
+ | |||
+ | ==== Spolupráce ==== | ||
+ | - výrazná spolupráce s anotací rozšířené textové koreference (Anja) | ||
+ | - anotace dialogu pro Companions (Silvie | ||
+ | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | ||
+ | |||
+ | ukázka megastromu, stav z března 2008: | ||
+ | {{megastrom2.png|}} | ||
+ | |||
+ | ==== Rozšíření pro Tred pro anotaci diskurzu ==== | ||
+ | 20081217 (JM): Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Zachovává funkčnost původního rozšíření, | ||
+ | že se dále budou možná vyvíjet jako jedno rozšíření. | ||
+ | == Jednoduchý návod k instalaci a použití: == | ||
==== Bibliografie k diskurzu ==== | ==== Bibliografie k diskurzu ==== |