Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:49] mirovsky |
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/29 09:38] mirovsky |
||
---|---|---|---|
Line 24: | Line 24: | ||
1) Předřadit modul, který to určí; úspěšnost by však musela být velice vysoká, jinak to považuju za zbytečné snižování celkové úspěšnosti. Nicméně není problém takový modul ve scénáři mít či mít možnost ho tam mít. | 1) Předřadit modul, který to určí; úspěšnost by však musela být velice vysoká, jinak to považuju za zbytečné snižování celkové úspěšnosti. Nicméně není problém takový modul ve scénáři mít či mít možnost ho tam mít. | ||
2) V rankingu určit mez, kterou musí vítězný kandidát překročit, | 2) V rankingu určit mez, kterou musí vítězný kandidát překročit, | ||
+ | |||
==== Kdo budou kandidáti? ==== | ==== Kdo budou kandidáti? ==== | ||
- | Předchozí osobní zájmena a podstatná jména, tedy tytéž markables. Předchozí až do nějaké vzdálenosti nebo všichni až do začátku textu? Respektive přesněji: předchozí diskurzní entity - již existující koreferenční řetězec by měl vystupovat jako jeden kandidát. (Nebudou se tím šířit předchozí chyby?) | + | Předchozí osobní zájmena a podstatná jména, tedy tytéž markables. Předchozí až do nějaké vzdálenosti nebo všichni až do začátku textu? Respektive přesněji: předchozí diskurzní entity - již existující koreferenční řetězec by měl vystupovat jako jeden kandidát. (Nebudou se tím šířit předchozí chyby? |
Narozdíl od některých přístupů bych za antecedent vždy volil nejbližší prvek budoucího koref. řetězce - tzn. i zájmeno může být antecedentem podstatného jména - to je možné právě díky posuzování kandidátů včetně jejich existujícího koref. řetězce. | Narozdíl od některých přístupů bych za antecedent vždy volil nejbližší prvek budoucího koref. řetězce - tzn. i zájmeno může být antecedentem podstatného jména - to je možné právě díky posuzování kandidátů včetně jejich existujícího koref. řetězce. | ||
Line 38: | Line 39: | ||
Co bude ranker posuzovat v jednom kroku? " | Co bude ranker posuzovat v jednom kroku? " | ||
Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, | Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, | ||
+ | |||
+ | |||
Line 52: | Line 55: | ||
=== Linguistic Form === | === Linguistic Form === | ||
- | Sleduje, zda kandidát | + | ** Personal Pronoun ** - je kandidát osobní |
- | Dále: | + | ** Proper Name ** - je kandidát vlastní jméno? |
- | ** Demonstrative Noun Phrase ** - visí na podstatném jménu anaphoru něco jako " | + | ** General Name ** - je kandidát obecné jméno? |
+ | |||
+ | ** Demonstrative Noun Phrase ** - visí na podstatném jménu anaphoru něco jako " | ||
=== Context === | === Context === | ||
Line 99: | Line 104: | ||
** Acronym ** - např. " | ** Acronym ** - např. " | ||
+ | |||
+ | === Salience === | ||
+ | |||
+ | ** Salience ** - pro antecedenty zájmen - aktivovanost v diskurzu (podle Hajičové? | ||
=== Vynecháno ze zmíněných článků, co se nehodí pro češtinu (nebo z jiných důvodů) === | === Vynecháno ze zmíněných článků, co se nehodí pro češtinu (nebo z jiných důvodů) === |