Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
projekt-anotace-diskurzu [2008/12/10 11:23] anotator |
projekt-anotace-diskurzu [2022/01/17 15:43] (current) ufal |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| - | ====== Projekt anotace diskurzu ====== | + | ====== Projekt anotace diskurzu |
| - | Doplňující aktuální informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https:// | ||
| - | ==== Předběžné poznámky a materiály k projektu ==== | + | ==== Cíle projektu ==== |
| - | Anotace diskurzu | + | Anotace diskurzu |
| + | Cílem je doplnit anotaci rozšířené koreference v PDT o další textové vztahy, které se podílejí na celkové koherenci textu. Jsou to zejména vztahy mezi větami (mezi stromy), a tudíž je TR zatím nezachycuje. TR pouze signalizuje některé z nich funktorem PREC, který ovšem postrádá bližší sémantickou specifikaci. Anotace nadvětných vztahů bude vycházet z hierarchické soustavy diskurzních vztahů vypracované Š. Zikánovou (Zikánová 2007) na základě soustavy vytvořené pro Penn Discourse TreeBank. Podobně jako v PDTB budeme postupovat od anotace konektorů (funktor PREC a další lexémy s touto funkcí, které ale mají v TR jiné funktory). V první fázi se nebudeme zabývat koordinačními vztahy uvnitř věty (uzly s nodetype=coap), | ||
| + | V druhé fázi bychom se vrátili zpět „dovnitř věty“, kde vidíme tyto dílčí úkoly: | ||
| + | - zpracování kategorie CM (conjuction modifier) a tedy víceslovných spojovacích výrazů | ||
| + | - sémantické rozpracování koordinačního vztahu APPS (apozice), sémantické zpracování nepravých vedlejších vět a vztah vsuvky (PAR) ke větě, do níž je vsunuta | ||
| + | Z mezivětných vztahů bychom doplnili: | ||
| + | - propojení přímé řeči o více větách (stromech) | ||
| + | - spojení všech parcelací | ||
| - | ==== Kdo se v tom angažuje ==== | ||
| - | lingvisticky: | ||
| - | technicky: Zdeněk Žabokrtský, | ||
| - | ==== Zadané práce ==== | ||
| - | LM + ZB: disertace, (ZB na FF :-)) | ||
| - | ==== Granty ==== | ||
| - | Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové | ||
| - | Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank | ||
| - | Zadané žádosti: | ||
| - | GAUK Lucie Mladové (3r) | ||
| - | GAUK Zuzanny Bedřichové (2r, FF UK) | ||
| - | GAUK Pavla Češky (1r, technická podpora) | ||
| + | ==== Na projektu se podílejí ==== | ||
| - | ==== Zápisy ze schůzek ==== | + | lingvisticky: |
| - | podklady pro schůzku 11-02-2008{{podklady_11-2-2008.pdf|}} | + | technicky: Jirka Mírovský (dříve i Petr Pajas, Zdeněk Žabokrtský) |
| - | zápis-18-02-2008{{zapis-18-02-2008.pdf|}} | + | |
| - | aktuální plán postupu 20-10-2008{{diskurz-plan-1-.doc|}} | + | |
| - | zápis 07-11-2008 {{zapis-07-11-2008.doc|}} | + | |
| - | zápis 25-11-2008: výběr konektorů | + | |
| - | zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | + | |
| + | anotátoři: | ||
| - | ==== Další materiály ==== | + | **PJ** Pavlína Jínová |
| + | **VP** Veronika Pavlíková | ||
| + | **MR** Magdaléna Rysová | ||
| + | **JZ** Jana Zdeňková | ||
| + | (dříve i **HF** Helena Filipová) | ||
| - | - Anotace | + | |
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | ==== Průběh projektu ==== | ||
| + | |||
| + | [[projekt-anotace-diskurzu: | ||
| + | |||
| + | ==== VŠE K ANOTACI ==== | ||
| + | |||
| + | [[: | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | ==== Různé materiály ==== | ||
| - Odkaz na [[http:// | - Odkaz na [[http:// | ||
| - | - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} | + | - [[instalace_PDTB|Instalace prohlížeče pro Penn Discourse Treebank]] |
| - | - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH | + | - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http:// |
| + | |http:// | ||
| + | - MANUÁL PDTB 2.0 ke stáhnutí {{internal:pdtb-annotation-manual.pdf|manual_PDTB_2}} | ||
| - Seznamy konektorů od Zuzky: | - Seznamy konektorů od Zuzky: | ||
| - | {{czech-connectives.xls|české konektory}} | + | {{internal:czech-connectives.xls|české konektory}} |
| - | {{czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} | + | {{internal:czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} |
| - | {{konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} | + | {{internal:konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} |
| - | - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | + | - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal:poznamky-k-manualu-pdtb_changed.doc|}} |
| - | - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | + | - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal: |
| + | - Základní bibliografie k podklasifikaci textovych vztahů{{internal: | ||
| - | ==== Spolupráce | + | ==== Bylo ==== |
| - | - výrazná kooperace s anotací TFA a koreference | + | (LM, 2.3.2009) |
| - | - anotace dialogu | + | - další úpravy tredu pro anotaci v kontextu discourse |
| - | - technicky: vytvoření | + | - úpravy setu sémantických textových vztahů |
| + | - první cvičná data pro měření | ||
| + | - pondělní seminář 9.3. - přehled nejnovější práce | ||
| - | ukázka megastromu: | + | (LM, 5.1.2009) |
| - | {{megastrom2.png|}} | + | - první verze tredího kontextu discourse se zabíhá a zkouší |
| + | - konverze dat pro anotaci | ||
| Line 63: | Line 99: | ||
| + | |||
| + | |||
| + | ==== Spolupráce ==== | ||
| + | - výrazná spolupráce s anotací rozšířené textové koreference (Anja) | ||
| + | - anotace dialogu pro Companions (Silvie) | ||
| + | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | ||
| + | |||
| + | |||
| + | ==== Rozšíření TrEdu pro anotaci diskurzu ==== | ||
| + | |||
| + | Tred používá k anotaci diskurzu rozšíření, | ||
| + | [[projekt-anotace-diskurzu: | ||
| ==== Bibliografie k diskurzu ==== | ==== Bibliografie k diskurzu ==== | ||
