Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:01] mirovsky |
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:12] mirovsky |
||
---|---|---|---|
Line 25: | Line 25: | ||
Předchozí osobní zájmena a podstatná jména, tedy tytéž markables. Předchozí až do nějaké vzdálenosti nebo všichni až do začátku textu? Respektive přesněji: předchozí diskurzní entity - již existující koreferenční řetězec by měl vystupovat jako jeden kandidát. (Nebudou se tím šířit předchozí chyby?) | Předchozí osobní zájmena a podstatná jména, tedy tytéž markables. Předchozí až do nějaké vzdálenosti nebo všichni až do začátku textu? Respektive přesněji: předchozí diskurzní entity - již existující koreferenční řetězec by měl vystupovat jako jeden kandidát. (Nebudou se tím šířit předchozí chyby?) | ||
+ | Narozdíl od některých přístupů bych za antecedent vždy volil nejbližší prvek budoucího koref. řetězce - tzn. i zájmeno může být antecedentem podstatného jména - to je možné právě díky posuzování kandidátů včetně jejich existujícího koref. řetězce. | ||
** Jaká metoda, jaké features? ** | ** Jaká metoda, jaké features? ** | ||
- | Ranking - ale jaký? | + | Supervised ranking. Unsupervised metody bych zvážil později, pokud by mohly přispět ke zvýšení úspěšnosti supervised metod, např. při adaptaci na jinou doménu apod. |
- | Co bude ranker posuzovat v jednom kroku? | + | **Ranking - ale jaký?** |
+ | |||
+ | Co bude ranker posuzovat v jednom kroku? | ||
Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, | Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, | ||
Line 38: | Line 41: | ||
- ostatní podstatná jména | - ostatní podstatná jména | ||
- | Features bych vzal z různých článků, např. Denis and Baldridge (2008?), Soon et al. (2001) | + | Features bych pro začátek |
- | + | ||