[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:39]
mirovsky
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:47]
mirovsky
Line 35: Line 35:
 Co bude ranker posuzovat v jednom kroku? "Anaphor + 1 kandidát" nebo "anaphor + kandidát + všichni ostatní kandidáti"? Mám pocit, že všichni to dělají jen "anaphor + 1 kandidát" - tím můžeme začít, ale nechal bych si možnost rozšířit to. Napadá mě featura typu "Je mezi ostatními kandidáty vlastní jméno?". Co bude ranker posuzovat v jednom kroku? "Anaphor + 1 kandidát" nebo "anaphor + kandidát + všichni ostatní kandidáti"? Mám pocit, že všichni to dělají jen "anaphor + 1 kandidát" - tím můžeme začít, ale nechal bych si možnost rozšířit to. Napadá mě featura typu "Je mezi ostatními kandidáty vlastní jméno?".
 Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, ale už i s jeho koreferenty - mám pocit, že už to někdo někde takhle taky dělal (?). Kandidát pak dostane skóre na základě "shody" i s těmi koreferenty. Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, ale už i s jeho koreferenty - mám pocit, že už to někdo někde takhle taky dělal (?). Kandidát pak dostane skóre na základě "shody" i s těmi koreferenty.
 +
 +
  
 ==== Features ==== ==== Features ====
Line 55: Line 57:
 === Context === === Context ===
  
-POS slov kolem kandidáta (před, po, okolo)+** POS Left ** - POS slova vlevo od kandidáta 
 + 
 +** POS Right ** - POS slova vpravo od kandidáta 
 + 
 +** POS Surr ** - POS slova vlevo a slova vpravo od kandidáta
  
 === Distance === === Distance ===
Line 82: Line 88:
  
 ** Right substring ** ** Right substring **
- 
-** Head word match ** - to je featura z Denise, ale co to je? 
  
 === Apposition === === Apposition ===
Line 92: Line 96:
  
 ** Acronym ** - např. "ČR" a "republika, na které visí česká" - tady můžeme dobře využít analytickou rovinu ** Acronym ** - např. "ČR" a "republika, na které visí česká" - tady můžeme dobře využít analytickou rovinu
 +
 +=== Vynecháno ze zmíněných článků, co se nehodí pro češtinu (nebo z jiných důvodů) ===
 +
 +- kandidát je definite/undefinite noun phrase
 +- Semantic Class Agreement - (female, male, person, organization, location, date, time, money, percent, object) - vyžaduje nástroj, který by to určil
 +- Head word match - to je featura z Denise, ale co to je?
 +
  
  

[ Back to the navigation ] [ Back to the content ]