Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
projekt-anotace-diskurzu [2008/12/10 14:26] anotator |
projekt-anotace-diskurzu [2022/01/17 15:43] (current) ufal |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Projekt anotace diskurzu (mezipropozičních | + | ====== Projekt anotace diskurzu (textových, promluvových |
- | + | ||
- | Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https:// | + | |
Line 16: | Line 13: | ||
- propojení přímé řeči o více větách (stromech) | - propojení přímé řeči o více větách (stromech) | ||
- spojení všech parcelací | - spojení všech parcelací | ||
+ | |||
+ | |||
+ | |||
Line 21: | Line 21: | ||
==== Na projektu se podílejí ==== | ==== Na projektu se podílejí ==== | ||
- | lingvisticky: | + | lingvisticky: |
- | technicky: Zdeněk Žabokrtský, Jirka Mírovský, Pavel Češka | + | technicky: |
- | ==== Zadané práce ==== | + | anotátoři: |
- | LM + ZB: disertace, (ZB na FF :-)) | + | |
+ | **PJ** Pavlína Jínová | ||
+ | **VP** Veronika Pavlíková | ||
+ | **MR** Magdaléna Rysová | ||
+ | **JZ** Jana Zdeňková | ||
+ | (dříve i **HF** Helena Filipová) | ||
- | ==== Plánovaná podpora projekty ==== | ||
- | Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové | ||
- | Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank | ||
- | Zadané návrhy na granty (všechny nové): | ||
- | GAUKy : | ||
- | 3letý GAUK LM na anotaci konektorů | ||
- | 2letý GAUK ZB na sémantiku synsémantik (na FF) | ||
- | 1letý GAUK Pavla Češky na technickou podporu anotace diskurzu | ||
- | ==== Zápisy ze schůzek ==== | ||
- | podklady pro schůzku 11-02-2008{{podklady_11-2-2008.pdf|}} | ||
- | zápis-18-02-2008{{zapis-18-02-2008.pdf|}} | ||
- | aktuální plán postupu 20-10-2008{{diskurz-plan-1-.doc|}} | ||
- | zápis 07-11-2008 {{zapis-07-11-2008.doc|}} | ||
- | zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} | ||
- | zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | ||
- | ==== Další materiály | + | |
- | - Anotace | + | |
+ | |||
+ | |||
+ | |||
+ | ==== Průběh projektu | ||
+ | |||
+ | [[projekt-anotace-diskurzu: | ||
+ | |||
+ | ==== VŠE K ANOTACI ==== | ||
+ | |||
+ | [[: | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Různé materiály ==== | ||
- Odkaz na [[http:// | - Odkaz na [[http:// | ||
- | - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} | + | - [[instalace_PDTB|Instalace prohlížeče pro Penn Discourse Treebank]] |
- | - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH | + | - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http:// |
+ | |http:// | ||
+ | - MANUÁL PDTB 2.0 ke stáhnutí {{internal:pdtb-annotation-manual.pdf|manual_PDTB_2}} | ||
- Seznamy konektorů od Zuzky: | - Seznamy konektorů od Zuzky: | ||
- | {{czech-connectives.xls|české konektory}} | + | {{internal:czech-connectives.xls|české konektory}} |
- | {{czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} | + | {{internal:czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} |
- | {{konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} | + | {{internal:konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} |
- | - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | + | - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal:poznamky-k-manualu-pdtb_changed.doc|}} |
- | - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | + | - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal: |
+ | - Základní bibliografie k podklasifikaci textovych vztahů{{internal: | ||
+ | |||
+ | ==== Bylo ==== | ||
+ | (LM, 2.3.2009) | ||
+ | - další úpravy tredu pro anotaci v kontextu discourse | ||
+ | - úpravy setu sémantických textových vztahů | ||
+ | - první cvičná data pro měření shody | ||
+ | - pondělní seminář 9.3. - přehled nejnovější práce | ||
+ | |||
+ | (LM, 5.1.2009) | ||
+ | - první verze tredího kontextu discourse se zabíhá a zkouší | ||
+ | - konverze dat pro anotaci | ||
- | ==== Aktuálně ==== | ||
- | - domyslet technické řešení anotace diskurzu | ||
- | - převést to do TrEdu | ||
- | - oanotovat vybrané konektory: | ||
- | **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, | ||
- | | ||
- | - první zkoumaný konektor: **přesto** | ||
- | - první zkoumaná skupina vztahů (z PDTB): **contingency** | ||
- | **- navržená tabulka vlastností konektorů pro anotaci:** | ||
- | - typ vztahu | ||
- | - nahraditelnost | ||
- | - vazba na pozici (větná, relativní) | ||
- | - souvýskyt (s možnými konektory, jiný souvýskyt) | ||
- | - negace | ||
- | - morfologické zvláštnosti okolí | ||
- | - odkaz do stejného stromu | ||
- | - ostatní | ||
Line 86: | Line 103: | ||
==== Spolupráce ==== | ==== Spolupráce ==== | ||
- výrazná spolupráce s anotací rozšířené textové koreference (Anja) | - výrazná spolupráce s anotací rozšířené textové koreference (Anja) | ||
- | - anotace dialogu pro Companions (Silvie | + | - anotace dialogu pro Companions (Silvie) |
- technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | ||
- | |||
- | ukázka megastromu, stav z března 2008: | ||
- | {{megastrom2.png|}} | ||
- | |||
- | |||
- | |||
+ | ==== Rozšíření TrEdu pro anotaci diskurzu ==== | ||
+ | Tred používá k anotaci diskurzu rozšíření, | ||
+ | [[projekt-anotace-diskurzu: | ||
==== Bibliografie k diskurzu ==== | ==== Bibliografie k diskurzu ==== |