[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:44]
mirovsky
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:49]
mirovsky
Line 15: Line 15:
  
 Na pojmenované entity bych se vykašlal, alespoň zatím. V datech bridging stejně máme šipky mezi jednotlivými uzly. Sice na tekto rovině, ale projekce do analytické roviny a zpět (tedy i na povrch) je podle mne jednoznačná. Na pojmenované entity bych se vykašlal, alespoň zatím. V datech bridging stejně máme šipky mezi jednotlivými uzly. Sice na tekto rovině, ale projekce do analytické roviny a zpět (tedy i na povrch) je podle mne jednoznačná.
 +
  
 ==== Jak poznat nové uvedení slova do diskurzu od slova, které koreferuje už s něčím dříve zmíněným? ==== ==== Jak poznat nové uvedení slova do diskurzu od slova, které koreferuje už s něčím dříve zmíněným? ====
 +
 +Neboli: Má z daného markable vést někam šipka? Je anaphorem nějakého antecedentu?
  
 Vidím dvě možnosti: Vidím dvě možnosti:
Line 35: Line 38:
 Co bude ranker posuzovat v jednom kroku? "Anaphor + 1 kandidát" nebo "anaphor + kandidát + všichni ostatní kandidáti"? Mám pocit, že všichni to dělají jen "anaphor + 1 kandidát" - tím můžeme začít, ale nechal bych si možnost rozšířit to. Napadá mě featura typu "Je mezi ostatními kandidáty vlastní jméno?". Co bude ranker posuzovat v jednom kroku? "Anaphor + 1 kandidát" nebo "anaphor + kandidát + všichni ostatní kandidáti"? Mám pocit, že všichni to dělají jen "anaphor + 1 kandidát" - tím můžeme začít, ale nechal bych si možnost rozšířit to. Napadá mě featura typu "Je mezi ostatními kandidáty vlastní jméno?".
 Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, ale už i s jeho koreferenty - mám pocit, že už to někdo někde takhle taky dělal (?). Kandidát pak dostane skóre na základě "shody" i s těmi koreferenty. Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, ale už i s jeho koreferenty - mám pocit, že už to někdo někde takhle taky dělal (?). Kandidát pak dostane skóre na základě "shody" i s těmi koreferenty.
 +
  
  
Line 56: Line 60:
 === Context === === Context ===
  
-POS slov kolem kandidáta (3 featury: před, po, oba okolo)+** POS Left ** - POS slova vlevo od kandidáta 
 + 
 +** POS Right ** - POS slova vpravo od kandidáta 
 + 
 +** POS Surr ** - POS slova vlevo a slova vpravo od kandidáta
  
 === Distance === === Distance ===
Line 83: Line 91:
  
 ** Right substring ** ** Right substring **
- 
-** Head word match ** - to je featura z Denise, ale co to je? 
  
 === Apposition === === Apposition ===
Line 98: Line 104:
 - kandidát je definite/undefinite noun phrase - kandidát je definite/undefinite noun phrase
 - Semantic Class Agreement - (female, male, person, organization, location, date, time, money, percent, object) - vyžaduje nástroj, který by to určil - Semantic Class Agreement - (female, male, person, organization, location, date, time, money, percent, object) - vyžaduje nástroj, který by to určil
 +- Head word match - to je featura z Denise, ale co to je?
 +
  
  

[ Back to the navigation ] [ Back to the content ]