[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:50]
mirovsky
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/29 09:38]
mirovsky
Line 39: Line 39:
 Co bude ranker posuzovat v jednom kroku? "Anaphor + 1 kandidát" nebo "anaphor + kandidát + všichni ostatní kandidáti"? Mám pocit, že všichni to dělají jen "anaphor + 1 kandidát" - tím můžeme začít, ale nechal bych si možnost rozšířit to. Napadá mě featura typu "Je mezi ostatními kandidáty vlastní jméno?". Co bude ranker posuzovat v jednom kroku? "Anaphor + 1 kandidát" nebo "anaphor + kandidát + všichni ostatní kandidáti"? Mám pocit, že všichni to dělají jen "anaphor + 1 kandidát" - tím můžeme začít, ale nechal bych si možnost rozšířit to. Napadá mě featura typu "Je mezi ostatními kandidáty vlastní jméno?".
 Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, ale už i s jeho koreferenty - mám pocit, že už to někdo někde takhle taky dělal (?). Kandidát pak dostane skóre na základě "shody" i s těmi koreferenty. Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, ale už i s jeho koreferenty - mám pocit, že už to někdo někde takhle taky dělal (?). Kandidát pak dostane skóre na základě "shody" i s těmi koreferenty.
 +
 +
  
  
Line 53: Line 55:
 === Linguistic Form === === Linguistic Form ===
  
-Sleduje, zda kandidát je vlastní jméno, obecné jméno nebo zájmeno.+** Personal Pronoun ** - je kandidát osobní zájmeno?
  
-Dále:+** Proper Name ** - je kandidát vlastní jméno?
  
-** Demonstrative Noun Phrase ** - visí na podstatném jménu anaphoru něco jako "tento, tato apod."?+** General Name ** - je kandidát obecné jméno? 
 + 
 +** Demonstrative Noun Phrase ** - visí na podstatném jménu anaphoru něco jako "tento, tato apod."? Je stejné pro všechny kandidáty! Ale vhodné pro rozhodování, zda z daného uzlu vést šipku nebo ne.
  
 === Context === === Context ===
Line 100: Line 104:
  
 ** Acronym ** - např. "ČR" a "republika, na které visí česká" - tady můžeme dobře využít analytickou rovinu ** Acronym ** - např. "ČR" a "republika, na které visí česká" - tady můžeme dobře využít analytickou rovinu
 +
 +=== Salience ===
 +
 +** Salience ** - pro antecedenty zájmen - aktivovanost v diskurzu (podle Hajičové?)
  
 === Vynecháno ze zmíněných článků, co se nehodí pro češtinu (nebo z jiných důvodů) === === Vynecháno ze zmíněných článků, co se nehodí pro češtinu (nebo z jiných důvodů) ===

[ Back to the navigation ] [ Back to the content ]