Institute of Formal and Applied Linguistics Wiki

Informační struktura věty a výstavba diskursu

Eva Hajičová, Šárka Zikánová


Informační struktura věty (nebo v tradiční terminologii aktuální členění věty), tedy její členění na část (základ), o které věta vypovídá, a na část, která je jejím ohniskem, je důležitým východiskem pro studium celků větších než věta, tedy diskursu (textu) a jeho výstavby. V přednášce bude nejprve pojednáno o sémantickém dosahu tohoto větného členění, o způsobu jeho zachycení ve formálním popisu jazyka a o jazykových prostředcích k jeho vyjádření. Podstatná pozornost bude věnována tomu, jak je tento aspekt struktury věty zachycen v počítačovém Pražském závislostním korpusu a jak lze korpusu využít k ověřování teoretických hypotéz. Ve druhé části se zaměříme na otázky výstavby nadvětných celků (diskursu), především z hlediska toho, jak lze poznatků o struktuře věty využít pro studium různých aspektů diskursu; i zde využijeme materiálu Pražského závislostního korpusu, a to především sledování korefernčních a anaforických vztahů v textu a možností jejich počítačové analýzy.


1. Pojem informační struktury věty (v tradiční terminologii: aktuální členění věty) jako sémanticky relevantního aspektu větné stavby a jazykové prostředky jeho vyjádření v různých typech jazyků.
2. Zachycení informační struktury ve formálním popisu jazyka.
3. Informační struktura a její anotování v počítačovém Pražském závislostním korpusu.
4. Vužití anotovaného počítačového korpusu k ověřování teoretických hypotéz obecně a v oblasti informační struktury věty zvlášť.
5. Od stavby věty k výstavbě nadvětných celků (diskursu): jak lze poznatků o struktuře věty využít pro studium různých aspektů diskursu.
6. Pojem společné zásoby znalostí mluvčího a posluchače a hierarchie stupňů aktivovanosti jednotlivých prvků tésto zásoby. Aplikace na rozbor textů různého stylistického charakteru.
7. Otázky reference výrazů v textu, odkazování v textu, koreference.
8. Zachycení koreference v Pražském závislostním korpusu, a možností počítačové analýzy koreferenčních vztahů.

Hodinový rozsah:
2 hod. týdně … 1/1, … zima

Forma výuky:
přednáška + seminář

Pro koho je kurz určen:
studenti magisterského a doktorandského studia

Způsob examinace:


Information structure of a sentence and discourse structure

Eva Hajičová, Šárka Zikánová


The information structure of a sentence (or according to the Czech traditional terminology, the topic-focus articulation – a division of a sentence into the part the sentence is about and the focus part) is an important starting point for an analysis of higher units than a sentence, namely discourse (text) and its structure. The course will deal with a semantic consequences of the topic-focus articulation, with its treatment in the formal description of a language and with langauge-dependent means of the expression of the topic-focus articulation. Special attention will be paid to the way in which this aspect of the sentential structure is treated in the electronic Prague Dependency Treebank and to the question how the corpus can be used for a verification of linguistic hypotheses. In the second part of the course, the questions of the discourse structure will be discussed, especially how the observations of the sentential structure can be used in the study of different aspects of discourse. In this part, we will use the material from Prague Dependency Treebank as well, namely the annotation of coreferential and anaphoric relations.

1. Information structure of a sentence (in the Czech traditional terminology: topic-focus articulation) as a semanticly relevant aspect of the sentential structure and means of the expression of the topic-focus articulation in different types of languages.
2. Treatment of the information structure in the formal description of a language.
3. Information structure and its annotation in the Prague Dependency Treebank.
4. Use of the annotated electronic corpus for a verification of linguistic hypotheses, with a special concern on the information structure.
5. From the structure of the sentence to the discourse structure: how the observations of the sentential structure can be used in the study of different aspects of discourse.
6. The common stock of knowledge of the speaker and the hearer and the salience of single elements within the stock. Application of the theory in the analysis of texts belonging to different styles.
7. The reference of expressions in a text, anaphoric relations, coreference.
8. The treatment of the coreference in the Prague Dependency Treebank; possibilities of an automatic analysis of coreferential relations.

