Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
diskurz_doporucena_literatura [2012/06/11 15:22] hladka |
diskurz_doporucena_literatura [2012/06/11 15:30] (current) hladka |
||
---|---|---|---|
Line 1: | Line 1: | ||
===== Doporučená literatura ===== | ===== Doporučená literatura ===== | ||
- | * Rodger Kibble, Richard Power. 2004. Optimizing referential coherence in text generation. // | + | * **Rodger Kibble, Richard Power. 2004. Optimizing referential coherence in text generation. // |
**Abstract** | **Abstract** | ||
This article describes an implemented system which uses centering theory for planning of coherent texts and choice of referring expressions. We argue that text and sentence planning need to be driven in part by the goal of maintaining referential continuity and thereby facilitating pronoun resolution: Obtaining a favorable ordering of clauses, and of arguments within clauses, is likely to increase opportunities for nonambiguous pronoun use. Centering theory provides the basis for such an integrated approach. Generating coherent texts according to centering theory is treated as a constraint satisfaction problem. The well-known Rule 2 of centering theory is reformulated in terms of a set of constraints—cohesion, | This article describes an implemented system which uses centering theory for planning of coherent texts and choice of referring expressions. We argue that text and sentence planning need to be driven in part by the goal of maintaining referential continuity and thereby facilitating pronoun resolution: Obtaining a favorable ordering of clauses, and of arguments within clauses, is likely to increase opportunities for nonambiguous pronoun use. Centering theory provides the basis for such an integrated approach. Generating coherent texts according to centering theory is treated as a constraint satisfaction problem. The well-known Rule 2 of centering theory is reformulated in terms of a set of constraints—cohesion, | ||
Line 10: | Line 11: | ||
Teoretickým základem je tzv. teorie center („centering theory“). „Centering theory“ je spojena zejm. se jmény Grosz, Joshi a Weinstein a dále např. McCoy, Strube, Henschel, Cheng a Poesio. | Teoretickým základem je tzv. teorie center („centering theory“). „Centering theory“ je spojena zejm. se jmény Grosz, Joshi a Weinstein a dále např. McCoy, Strube, Henschel, Cheng a Poesio. | ||
- | K „centering theory“ (CT) | + | K //centering theory// (CT) |
Týká se určování vztahů mezi anaforicky provázanými elementy – srov. věty: | Týká se určování vztahů mezi anaforicky provázanými elementy – srov. věty: | ||
Line 16: | Line 17: | ||
(1) Petra má ráda Pavlu. Často ji navštěvuje. Ráda se dívá na filmy, a proto obě často chodí do kina. | (1) Petra má ráda Pavlu. Často ji navštěvuje. Ráda se dívá na filmy, a proto obě často chodí do kina. | ||
- | Gramatický rod už nestačí k tomu, abychom ve druhé větě správně identifikovali zájmeno ji (resp. kdo koho navštěvuje). Přesto víme, že ji se s velkou pravděpodobností vztahuje na Pavlu a že podmětem k přísudku navštěvuje je spíše Petra. CT se snaží charakterizovat právě tento druh diskurzní koherence. K tomu slouží mj. pojem SALIENCE (= stupeň aktivovanosti urč. prvku v textu). Petra je aktivovanějším prvkem (má vyšší stupeň salience) než Pavla, protože je v roli podmětu v první větě. | + | Gramatický rod už nestačí k tomu, abychom ve druhé větě správně identifikovali zájmeno |
(2) S Radkem není něco v pořádku. Chová se divně. Včera volal ve tři ráno Kubovi. (#Radek ho chtěl…) Chtěl ho za každou cenu vidět. | (2) S Radkem není něco v pořádku. Chová se divně. Včera volal ve tři ráno Kubovi. (#Radek ho chtěl…) Chtěl ho za každou cenu vidět. | ||
- | Na druhou stranu v příkladu (2) v poslední větě užijeme spíše nevyjádřeného podmětu, než abychom opakovali slovo Radek. Je to proto, že prvek Radek je stále vysoce aktivovaný, | + | Na druhou stranu v příkladu (2) v poslední větě užijeme spíše nevyjádřeného podmětu, než abychom opakovali slovo //Radek//. Je to proto, že prvek //Radek// je stále vysoce aktivovaný, |
+ | |||
+ | Každý text se skládá ze sekvencí několika vět U1, U2, U3 … Un. Každý diskurzní referent v nich má určitý stupeň salience. Stupeň aktivovanosti jednoho diskurzního referentu se přitom v „průběhu“ textu mění. | ||
+ | |||
+ | Pro každou větnou jednotku Ui existuje seznam diskurzních referentů s dosahem „dopředu“, | ||
+ | |||
+ | V seznamu existuje určité pořadí. To je spojeno se syntaktickou rolí diskurzních referentů: **podmět > přímý předmět > nepřímý předmět > ostatní**. | ||
+ | |||
+ | Nejvýše řazený prvek z CF je tzv. preferované centrum („**Preferred Center**“), | ||
+ | |||
+ | Pro věty Ui diskurzu D, kterými text nezačíná, | ||
+ | |||
+ | Příklady | ||
+ | |||
+ | 1. Honza1 má rád Adama2. | ||
+ | CB: 0; CF: <Honza, Adam> | ||
+ | |||
+ | 2. Navštěvuje (on1) ho2 často. | ||
+ | CB: Honza; CF: <Honza, Adam> | ||
+ | |||
+ | 3. Rád (on1) se s ním2 dívá na filmy3. | ||
+ | CB: Honza; CF: <Honza, Adam, filmy> | ||
+ | |||
+ | 4. Adam2 má filmy3 rád. | ||
+ | CB: Adam; CF: <Adam, filmy> | ||
+ | |||
+ | **Jazyková realizace diskurzních referentů** (vsuvka) (srov. http:// | ||
+ | |||
+ | Pokud jsou prvky v CF realizovány zájmeny, pak je také CB vyjádřeno zájmenem. | ||
+ | |||
+ | 1. Lenka1 má ráda Jitku2. | ||
+ | CB: 0; CF: <Lenka, Jitka> | ||
+ | |||
+ | 2. (Ona1) Navštěvuje ji2 často. | ||
+ | **CB: Lenka**; CF: <Lenka, Jitka> | ||
+ | |||
+ | 2.‘ (**Ona1**) Navštěvuje Jitku2 často. | ||
+ | |||
+ | 2.# **Lenka1** navštěvuje Jitku2 často. | ||
+ | |||
+ | CB je realizováno zájmenem. | ||
+ | |||
+ | 1. Lenka1 má ráda Jitku2. | ||
+ | CB: 0; CF: <Lenka, Jitka> | ||
+ | |||
+ | 2. (**Ona1**) Navštěvuje Jitku2 často. | ||
+ | **CB: Lenka**; CF: <Jitka, Lenka> | ||
+ | |||
+ | 2.# **Lenka1** navštěvuje Jitku2 často. | ||
+ | |||
+ | Pokud je CB aktuální věty totožný diskurzní referent s CB poslední věty, pak je realizováno zájmenem. | ||
+ | |||
+ | 1. Lenka1 má ráda Jitku2. | ||
+ | CB: 0; CF: <Lenka, Jitka> | ||
+ | |||
+ | 2. (**Ona1**) Často ji2 navštěvuje. | ||
+ | **CB: Lenka**; CF: <Lenka, Jitka> | ||
+ | |||
+ | 3. (**Ona1**) Ráda se dívá s Jitkou2 na filmy3. | ||
+ | **CB: Lenka**; CF: <Lenka, Jitka, filmy> | ||
+ | |||
+ | 3.# Lenka1 se ráda dívá s Jitkou2 na filmy3. | ||
+ | |||
+ | Pokud je prvek z CF (Ui–1, D) již v Ui realizován zájmenem, pak je také v CB (Ui, D) realizován zájmenem. | ||
+ | |||
+ | 1. Lenka1 má ráda Jitku2. | ||
+ | CB: 0; CF: <Lenka, Jitka> | ||
+ | |||
+ | 2. **Lenka1 ji2** často navštěvuje. | ||
+ | CB: Lenka; CF: <Lenka, Jitka> | ||
+ | |||
+ | 3. (**Ona1**) Ráda se dívá s Jitkou2 na filmy3. | ||
+ | **CB: Lenka**; CF: <Lenka, Jitka, filmy> | ||
+ | |||
+ | 3.# **Lenka1** se ráda dívá s Jitkou2 na filmy3. | ||
+ | |||
+ | **Důležité textové rysy** | ||
+ | |||
+ | **koheze** | ||
+ | CB (Un – 1) = CB (Un) | ||
+ | |||
+ | **salience** | ||
+ | CP (Un) = CB (Un) | ||
+ | |||
+ | **„cheapness“** | ||
+ | CP (Un – 1) = CB (Un) | ||
+ | |||
+ | **kontinuita** | ||
+ | CFs (Un-1) ∩ CFs (Un) ≠ 0 | ||
+ | („v každé nové větě se říká něco starého“) | ||
+ | |||
+ | **Realizace textových vzorců s využitím koheze, salience, „cheapness“, | ||
+ | |||
+ | Viz tabulka v textu článku, s. 414. | ||
- | Každý text se skládá ze sekvencí několika vět U1, U2, U3 … Un. Každý diskurzní referent v nich má určitý stupeň salience. Stupeň aktivovanosti jednoho diskurzního referentu se přitom v „průběhu“ textu mění. | ||
- | Pro každou větnou jednotku Ui existuje seznam diskurzních referentů s dosahem „dopředu“, | ||
- | V seznamu existuje určité pořadí. To je spojeno se syntaktickou rolí diskurzních referentů: podmět > přímý předmět > nepřímý předmět > ostatní. | ||
- | Nejvýše řazený prvek z CF je tzv. preferované centrum („Preferred Center“), značí se CP (Ui, D) – podle výše zmíněné stupnice je jím tedy podmět. | ||
- | Pro věty Ui diskurzu D, kterými text nezačíná, | ||
- | | + | ***Florian Wolf, Edward Gibson. 2005. Representing Discourse Coherence: A Corpus-Based Study. // |
**Abstract** | **Abstract** |