[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 17:28]
mirovsky vytvořeno
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 17:44]
mirovsky
Line 1: Line 1:
 ===== Automatické určování koreference ===== ===== Automatické určování koreference =====
  
-=== poznámky ke schůzce 29. září ===+=== __poznámky ke schůzce 29. září__ ===
  
  
Line 10: Line 10:
  
  
-**Otázka 1: Co budou markables? **+** Co budou markables? **
  
-Podle mne všechna podstatná jména a všechna osobní zájmena. Přinejmenším zpočátku, pak se to může vylepšovat či rozšiřovat na další zájmena. Řídil bych se především potřebami projektu PlayCoref a tím, co je anotováno v projektu Bridging.+Podle mne všechna podstatná jména a všechna osobní zájmena. Přinejmenším zpočátku, pak se to může vylepšovat či rozšiřovat. Řídil bych se především potřebami projektu PlayCoref a tím, co je anotováno v projektu Bridging.
  
-**Otázka 2: Jak poznat+Na pojmenované entity bych se vykašlal, alespoň zatím. V datech bridging stejně máme šipky mezi jednotlivými uzly. Sice na tekto rovině, ale projekce do analytické roviny a zpět (tedy i na povrch) je podle mne jednoznačná.
  
 +** Jak poznat nové uvedení slova do diskurzu od slova, které koreferuje už s něčím dříve zmíněným? **
  
 +Vidím dvě možnosti:
 +1) Předřadit modul, který to určí; úspěšnost by však musela být velice vysoká, jinak to považuju za zbytečné snižování celkové úspěšnosti. Nicméně není problém takový modul ve scénáři mít či mít možnost ho tam mít.
 +2) V rankingu určit mez, kterou musí vítězný kandidát překročit, aby vůbec nějaká koreference byla označena. Může i koexistovat s předchozím modulem.
  
-features pro ranking (a jejich váhy) budou různé pro různé typy anaphor (pozná se podle tagu), nejméně tyto tři typy:+** Jaká metoda, jaké features? ** 
 + 
 +Ranking - ale jaký? 
 + 
 +Co bude ranker posuzovat v jednom kroku? //Anaphor + 1 kandidát// nebo //anaphor + kandidát + všichni ostatní kandidáti//? Mám pocit, že všichni to dělají jen //anaphor + 1 kandidát// - tím můžeme začít, ale nechal bych si možnost rozšířit to. Napadá mě featura typu "Je mezi ostatními kandidáty vlastní jméno?"
 + 
 +Features pro ranking (a jejich váhy) budou různé pro různé typy anaphor (pozná se podle tagu), nejméně tyto tři typy:
 - zájmena - zájmena
 - vlastní jména - vlastní jména
 - ostatní podstatná jména - ostatní podstatná jména
 +
 +Features bych vzal z různých článků, např. Denis and Baldridge (2008?), Soon et al. (2001)
 +
 +
 +
  

[ Back to the navigation ] [ Back to the content ]