[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
diskurz_doporucena_literatura [2012/06/11 15:23]
hladka
diskurz_doporucena_literatura [2012/06/11 15:24]
hladka
Line 1: Line 1:
 ===== Doporučená literatura ===== ===== Doporučená literatura =====
  
-   * Rodger Kibble, Richard Power. 2004. Optimizing referential coherence in text generation. //Computational linguistics//, Vol. 30, No. 4, pp. 401-416. [[http://acl.ldc.upenn.edu/J/J04/J04-4001.pdf|pdf]] +   * **Rodger Kibble, Richard Power. 2004. Optimizing referential coherence in text generation. //Computational linguistics//, Vol. 30, No. 4, pp. 401-416. [[http://acl.ldc.upenn.edu/J/J04/J04-4001.pdf|pdf]]**  
 **Abstract** **Abstract**
 This article describes an implemented system which uses centering theory for planning of coherent texts and choice of referring expressions. We argue that text and sentence planning need to be driven in part by the goal of maintaining referential continuity and thereby facilitating pronoun resolution: Obtaining a favorable ordering of clauses, and of arguments within clauses, is likely to increase opportunities for nonambiguous pronoun use. Centering theory provides the basis for such an integrated approach. Generating coherent texts according to centering theory is treated as a constraint satisfaction problem. The well-known Rule 2 of centering theory is reformulated in terms of a set of constraints—cohesion, salience, cheapness, and continuity—and we show sample outputs obtained under a particular weighting of these constraints. This framework facilitates detailed research into evaluation metrics and will therefore provide a productive research tool in addition to the immediate practical benefit of improving the fluency and readability of generated texts. The technique is generally applicable to natural language generation systems, which perform hierarchical text structuring based on a theory of coherence relations with certain additional assumptions. This article describes an implemented system which uses centering theory for planning of coherent texts and choice of referring expressions. We argue that text and sentence planning need to be driven in part by the goal of maintaining referential continuity and thereby facilitating pronoun resolution: Obtaining a favorable ordering of clauses, and of arguments within clauses, is likely to increase opportunities for nonambiguous pronoun use. Centering theory provides the basis for such an integrated approach. Generating coherent texts according to centering theory is treated as a constraint satisfaction problem. The well-known Rule 2 of centering theory is reformulated in terms of a set of constraints—cohesion, salience, cheapness, and continuity—and we show sample outputs obtained under a particular weighting of these constraints. This framework facilitates detailed research into evaluation metrics and will therefore provide a productive research tool in addition to the immediate practical benefit of improving the fluency and readability of generated texts. The technique is generally applicable to natural language generation systems, which perform hierarchical text structuring based on a theory of coherence relations with certain additional assumptions.
Line 10: Line 11:
 Teoretickým základem je tzv. teorie center („centering theory“). „Centering theory“ je spojena zejm. se jmény Grosz, Joshi a Weinstein a dále např. McCoy, Strube, Henschel, Cheng a Poesio.  Teoretickým základem je tzv. teorie center („centering theory“). „Centering theory“ je spojena zejm. se jmény Grosz, Joshi a Weinstein a dále např. McCoy, Strube, Henschel, Cheng a Poesio. 
  
- K //centering theor//(CT)  +K //centering theory// (CT)  
  
 Týká se určování vztahů mezi anaforicky provázanými elementy – srov. věty: Týká se určování vztahů mezi anaforicky provázanými elementy – srov. věty:
Line 32: Line 33:
 Pro věty Ui diskurzu D, kterými text nezačíná, existuje tzv. Backward-looking Center, značí se CB (Ui, D). Tím je nejvýše řazený prvek v CF (Ui-1, D), který se vyskytuje také v CF (Ui, D).  Pro věty Ui diskurzu D, kterými text nezačíná, existuje tzv. Backward-looking Center, značí se CB (Ui, D). Tím je nejvýše řazený prvek v CF (Ui-1, D), který se vyskytuje také v CF (Ui, D). 
  
-   *Florian Wolf, Edward Gibson. 2005. Representing Discourse Coherence: A Corpus-Based Study. //Computational Linguistics//, Vol. 31, No. 2, pp. 249--287. [[http://acl.ldc.upenn.edu/J/J05/J05-2005.pdf|pdf]]+Příklady 
 + 
 +1. Honza1 má rád Adama2.  
 +CB: 0; CF: <Honza, Adam> 
 + 
 +2. Navštěvuje (on1) ho2 často. 
 +CB: Honza; CF: <Honza, Adam> 
 + 
 +3. Rád (on1) se s ním2 dívá na filmy3. 
 +CB: Honza; CF: <Honza, Adam, filmy> 
 + 
 +4. Adam2 má filmy3 rád. 
 +CB: Adam; CF: <Adam, filmy> 
 + 
 +Jazyková realizace diskurzních referentů (vsuvka) 
 +(srov. http://amor.cms.hu-berlin.de/~h2816i3x/Lehre/2006_VL_Text/VL_Text_02_Centering.pdf) 
 + 
 +Pokud jsou prvky v CF realizovány zájmeny, pak je také CB vyjádřeno zájmenem. 
 + 
 +1. Lenka1 má ráda Jitku2. 
 +CB: 0; CF: <Lenka, Jitka> 
 + 
 +2. (Ona1) Navštěvuje ji2 často. 
 +CB: Lenka; CF: <Lenka, Jitka> 
 + 
 +2.‘ (Ona1) Navštěvuje Jitku2 často. 
 + 
 +2.# Lenka1 navštěvuje Jitku2 často. 
 + 
 +CB je realizováno zájmenem. 
 + 
 +1. Lenka1 má ráda Jitku2. 
 +CB: 0; CF: <Lenka, Jitka> 
 + 
 +2. (Ona1) Navštěvuje Jitku2 často. 
 +CB: Lenka; CF: <Jitka, Lenka> 
 + 
 +2.# Lenka1 navštěvuje Jitku2 často. 
 + 
 +Pokud je CB aktuální věty totožný diskurzní referent s CB poslední věty, pak je realizováno zájmenem. 
 + 
 +1. Lenka1 má ráda Jitku2. 
 +CB: 0; CF: <Lenka, Jitka> 
 + 
 +2. (Ona1) Často ji2 navštěvuje. 
 +CB: Lenka; CF: <Lenka, Jitka> 
 + 
 +3. (Ona1) Ráda se dívá s Jitkou2 na filmy3. 
 +CB: Lenka; CF: <Lenka, Jitka, filmy> 
 + 
 +3.# Lenka1 se ráda dívá s Jitkou2 na filmy3. 
 + 
 +Pokud je prvek z CF (Ui–1, D) již v Ui realizován zájmenem, pak je také v CB (Ui, D) realizován zájmenem. 
 + 
 +1. Lenka1 má ráda Jitku2. 
 +CB: 0; CF: <Lenka, Jitka> 
 + 
 +2. Lenka1 ji2 často navštěvuje. 
 +CB: Lenka; CF: <Lenka, Jitka> 
 + 
 +3. (Ona1) Ráda se dívá s Jitkou2 na filmy3. 
 +CB: Lenka; CF: <Lenka, Jitka, filmy> 
 + 
 +3.# Lenka1 se ráda dívá s Jitkou2 na filmy3. 
 + 
 +Důležité textové rysy 
 + 
 +koheze 
 +CB (Un – 1) = CB (Un) 
 + 
 +salience 
 +CP (Un) = CB (Un) 
 + 
 +„cheapness“ 
 +CP (Un – 1) = CB (Un) 
 + 
 +kontinuita 
 +CFs (Un-1) ∩ CFs (Un) ≠ 0  
 +(„v každé nové větě se říká něco starého“) 
 + 
 +Realizace textových vzorců s využitím koheze, salience, „cheapness“, kontinuity 
 + 
 +Viz tabulka v textu článku, s. 414. 
 + 
 + 
 +   ***Florian Wolf, Edward Gibson. 2005. Representing Discourse Coherence: A Corpus-Based Study. //Computational Linguistics//, Vol. 31, No. 2, pp. 249--287. [[http://acl.ldc.upenn.edu/J/J05/J05-2005.pdf|pdf]]**
  
 **Abstract** **Abstract**

[ Back to the navigation ] [ Back to the content ]