[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Projekt anotace diskurzu

Doplňující aktuální informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https://wiki.ufal.ms.mff.cuni.cz/internal:pdt25:navrhy

Předběžné poznámky a materiály k projektu

Anotace diskurzu se plánuje jako součást další, “vyšší” roviny v PDT, ve které bude podrobně zpracována koreference, pojmenované entity a textové vztahy (diskurz).

Kdo se v tom angažuje

lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová
technicky: Zdeněk Žabokrtský, Jirka Mírovský, Pavel Češka

Zadané práce

LM + ZB: disertace, (ZB na FF :-))

Granty

Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové
Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank

Zadané žádosti:
GAUK Lucie Mladové (3r)
GAUK Zuzanny Bedřichové (2r, FF UK)
GAUK Pavla Češky (1r, technická podpora)

Zápisy ze schůzek

podklady pro schůzku 11-02-2008podklady_11-2-2008.pdf
zápis-18-02-2008zapis-18-02-2008.pdf
aktuální plán postupu 20-10-2008diskurz-plan-1-.doc
zápis 07-11-2008 zapis-07-11-2008.doc
zápis 25-11-2008: výběr konektorů k preanotaci 25-11-2008.doc
zápis z 2-12-2008: technické řešení diskurzu technicke-reseni-diskurzu-2-.doc

Další materiály

- Anotace diskurzu v PDTprezentace pro pondělní seminář ÚFALu 26.11. 2007, ŠZ
- Odkaz na Penn Discourse Treebank 2.0
- MANUÁL PDTB 2.0 ke stáhnutí manual_PDTB_2
- Článek a prezentace o diskurzu na konferenci LREC 2008, LM, ŠZ, EH
- Seznamy konektorů od Zuzky:
české konektory
české konektory abecedně
doplněný seznam možných českých konektorů
- Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky)
- Zuzčiny poznámky k manuálu PDTB 2.0 poznamky-k-manualu-pdtb_changed.doc

Aktuálně

- domyslet technické řešení anotace diskurzu
- převést to do TrEdu
- oanotovat vybrané konektory, tj.: však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž,
nicméně, konkrétně, například, vlastně, vždyť, zatímco

- první zkoumaný konektor: přesto
- první zkoumaná skupina vztahů (z PDTB): contingency
- navržená tabulka vlastností konektorů:

-typ vztahu
-nahraditelnost
-vazba na pozici
- větná
- relativní
-souvýskyt
- s možnými konektory
- jiný souvýskyt
-negace
-morfologické zvláštnosti okolí
-odkaz do stejného stromu
-ostatní

Spolupráce

- výrazná kooperace s anotací TFA a koreference (rozvedení anotace textové koreference)
- anotace dialogu pro Companions (Silvie)
- technicky: vytvoření anotačního prostředí – kontext “megatree” v TrEdu, první hrubou verzi už dal dohromady Pepa Toman:

ukázka megastromu:

Bibliografie k diskurzu

výběr článků a statí:

Adamec, P. (1995). Konektivní částice a jiné textově propojovací výrazy v současné češtině. In Přednášky z 37. a 38. běhu LŠSS, Praha: Univerzita Karlova, s. 59-64.

Asher, N. (1993). Reference to Abstract Objects in Discourse. Kluwer Academic Publishers, Dordrecht.

Asher, N. – Lascarides, A. (2003). Logics of Conversation. Cambridge University Press.

Bedřichová, Z. (2008). Částice implikující presupozici v češtině, diplomová práce. Univerzita Karlova, Praha.

Daneš, F. (1985). Věta a text. Academia, Praha.

Hajič, J. et al. (2006). Prague Dependency Treebank 2.0. Linguistic Data Consortium, Philadelphia.

Hajičová, E. (1993). Issues of Sentence Structure and Discourse Patterns. Charles University, Prague.

Hajičová, E. et al. (2006). An Annotated Corpus as a Test Bed for Discourse Structure Analysis. In Proceedings of the Workshop on Constraints in Discourse, National University of Ireland, Maynooth, Ireland, pp. 82–89.

Halliday, M. A. K. – Hasan, R. (1976). Cohesion in English. Longman, London.

Helbig, H. (2005). Knowledge Representation and the Semantics of Natural Language. Springer.

Hobbs, J. R. (1985). On the Coherence and Structure of Discourse, Report No. CSLI-85-37, Center for the Study of Language and Information, Stanford University.

Hoffmannová, J. (1983). Sémantické a pragmatické aspekty koherence textu. Disertační práce, Linguistica VI, ČSAV, Praha.

Joshi, A. et al. (2006). Discourse Annotation: Discourse Connectives and Discourse Relations. Tutorial at the Association for Computational Linguistics, Sydney.

Lee, A. et al. (2006). Complexity of Dependencies in Discourse: Are Dependencies in Discourse More Complex Than in Syntax? Proceedings of the 5th International Workshop on Treebanks and Linguistic Theories. Prague.

Mikulová, M. et al. (2005). Annotation on the Tectogrammatical Layer in the Prague Dependency Treebank: Annotation Manual. Universitas Carolina Pragensis, Prague.

Miltsakaki, E. et al. (2004). The Penn Discourse Treebank. In Proceedings of the Fourth International Conference on Language Resources and Evaluation. LREC 2004, Lisbon, Portugal.

Mladová, L. (2008). Diskurzní vztahy v češtině a jejich zachycení v anotovaném korpusu. Diplomová práce. Univerzita Karlova, Praha.

Nedoluzhko, A. (2007). Zpráva k anotování rozšířené textové koreference a bridging vztahů v Pražském závislostním korpusu. Technická zpráva. Univerzita Karlova, Praha.

Novák, V. (2008). Semantic Network Manual Annotation and its Evaluation. Institute of Formal and Applied Linguistics, Charles University, Prague

Pasch, R. et al. (2003). Handbuch der deutschen Konnektoren. Walter De Gruyter Inc.

Prasat, R. et al. (2008). Penn Discourse Treebank Version 2.0. Linguistic Data Consortium, Philadelphia.

Seuren, P.A.M. (1985). Discourse Semantics. Blackwell Pub.

Sgall, P. et al. (1969). A Functional Approach to Syntax in Generative Description of Language. Američan Elsevier, New York.

The Penn Discourse Treebank 1.0 Annotation Manual. (2006). http://www.seas.upenn.edu/~pdtb/papers/pdtb-1.0-annotation-manual.pdf

The Penn Discourse Treebank 2.0 Annotation Manual. (2007). http://www.seas.upenn.edu/~pdtb/PDTBAPI/pdtb-annotation-manual.pdf

The Prague Czech-English Dependency Treebank 1.0 http://ufal.mff.cuni.cz/pcedt/doc/PCEDT_main.html

Webber, B. (2004). D-LTAG: Extending Lexicalized TAG to Discourse. Cognitive Science, 28 (5), pp. 751-779.

Zikánová, Š. (2007). Possibilities of Discourse Annotation in Prague Dependency Treebank (Based on the Penn Discourse Treebank Annotation). Technical report. Institute of Formal and Applied Linguistics, Charles University, Prague.


[ Back to the navigation ] [ Back to the content ]