Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
projekt-anotace-diskurzu [2008/12/10 11:32] anotator |
projekt-anotace-diskurzu [2008/12/15 22:33] ufal |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Projekt anotace diskurzu ====== | + | ====== Projekt anotace diskurzu |
- | Doplňující | + | Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https:// |
- | ==== Předběžné poznámky a materiály k projektu ==== | ||
- | Anotace diskurzu se plánuje jako součást další, “vyšší” roviny v PDT, ve které bude podrobně zpracována koreference, | ||
+ | ==== Cíle projektu ==== | ||
- | ==== Kdo se v tom angažuje | + | Anotace diskurzu je planována jako součást další, “vyšší” roviny v PDT, ve které bude podrobně zpracována koreference, |
+ | Cílem je doplnit anotaci rozšířené koreference v PDT o další textové vztahy, které se podílejí na celkové koherenci textu. Jsou to zejména vztahy mezi větami (mezi stromy), a tudíž je TR zatím nezachycuje. TR pouze signalizuje některé z nich funktorem PREC, který ovšem postrádá bližší sémantickou specifikaci. Anotace nadvětných vztahů bude vycházet z hierarchické soustavy diskurzních vztahů vypracované Š. Zikánovou (Zikánová 2007) na základě soustavy vytvořené pro Penn Discourse TreeBank. Podobně jako v PDTB budeme postupovat od anotace konektorů (funktor PREC a další lexémy s touto funkcí, které ale mají v TR jiné funktory). V první fázi se nebudeme zabývat koordinačními vztahy uvnitř věty (uzly s nodetype=coap), protože tyto textové vztahy (tj. vztahy v rámci jednoho stromu) jsou v TR dostatečně zpracované. | ||
+ | |||
+ | V druhé fázi bychom se vrátili zpět „dovnitř věty“, kde vidíme tyto dílčí úkoly: | ||
+ | - zpracování kategorie CM (conjuction modifier) a tedy víceslovných spojovacích výrazů | ||
+ | - sémantické rozpracování koordinačního vztahu APPS (apozice), sémantické zpracování nepravých vedlejších vět a vztah vsuvky (PAR) ke větě, do níž je vsunuta | ||
+ | Z mezivětných vztahů bychom doplnili: | ||
+ | - propojení přímé řeči o více větách (stromech) | ||
+ | - spojení všech parcelací | ||
+ | |||
+ | |||
+ | |||
+ | ==== Na projektu | ||
lingvisticky: | lingvisticky: | ||
Line 16: | Line 27: | ||
LM + ZB: disertace, (ZB na FF :-)) | LM + ZB: disertace, (ZB na FF :-)) | ||
- | ==== Granty | + | |
+ | ==== Plánovaná podpora projekty | ||
Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové | Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové | ||
Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank | Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank | ||
- | Zadané | + | Zadané |
- | GAUK Lucie Mladové (3r) | + | GAUKy : |
- | GAUK Zuzanny Bedřichové | + | 3letý |
- | GAUK Pavla Češky | + | 2letý |
+ | 1letý | ||
==== Zápisy ze schůzek ==== | ==== Zápisy ze schůzek ==== | ||
Line 33: | Line 45: | ||
zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} | zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} | ||
zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | ||
+ | zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}} | ||
==== Další materiály ==== | ==== Další materiály ==== | ||
Line 46: | Line 58: | ||
- Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | ||
- Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | ||
+ | |||
==== Aktuálně ==== | ==== Aktuálně ==== | ||
- domyslet technické řešení anotace diskurzu | - domyslet technické řešení anotace diskurzu | ||
- převést to do TrEdu | - převést to do TrEdu | ||
- | - oanotovat vybrané konektory, tj.: **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, | + | - oanotovat vybrané konektory: |
- | nicméně, konkrétně, | + | **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, |
+ | | ||
- první zkoumaný konektor: **přesto** | - první zkoumaný konektor: **přesto** | ||
- první zkoumaná skupina vztahů (z PDTB): **contingency** | - první zkoumaná skupina vztahů (z PDTB): **contingency** | ||
- | - navržená tabulka vlastností konektorů: | ||
- | -typ vztahu | + | **- navržená tabulka vlastností konektorů pro anotaci: |
- | -nahraditelnost | + | |
- | -vazba na pozici | + | |
- | - větná | + | - nahraditelnost |
- | - relativní | + | - vazba na pozici |
- | -souvýskyt | + | - souvýskyt |
- | - s možnými konektory | + | - negace |
- | - jiný souvýskyt | + | - morfologické zvláštnosti okolí |
- | -negace | + | - odkaz do stejného stromu |
- | -morfologické zvláštnosti okolí | + | - ostatní |
- | -odkaz do stejného stromu | + | |
- | -ostatní | + | |
==== Spolupráce ==== | ==== Spolupráce ==== | ||
- | - výrazná | + | - výrazná |
- | - anotace dialogu pro Companions (Silvie) | + | - anotace dialogu pro Companions (Silvie |
- | - technicky: vytvoření anotačního prostředí – kontext | + | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, |
- | ukázka megastromu: | + | ukázka megastromu, stav z března 2008: |
{{megastrom2.png|}} | {{megastrom2.png|}} | ||