Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:47] mirovsky |
user:mirovsky:poznamky-k-automatickemu-urcovani-koreference [2009/09/25 18:53] mirovsky |
||
---|---|---|---|
Line 15: | Line 15: | ||
Na pojmenované entity bych se vykašlal, alespoň zatím. V datech bridging stejně máme šipky mezi jednotlivými uzly. Sice na tekto rovině, ale projekce do analytické roviny a zpět (tedy i na povrch) je podle mne jednoznačná. | Na pojmenované entity bych se vykašlal, alespoň zatím. V datech bridging stejně máme šipky mezi jednotlivými uzly. Sice na tekto rovině, ale projekce do analytické roviny a zpět (tedy i na povrch) je podle mne jednoznačná. | ||
+ | |||
==== Jak poznat nové uvedení slova do diskurzu od slova, které koreferuje už s něčím dříve zmíněným? | ==== Jak poznat nové uvedení slova do diskurzu od slova, které koreferuje už s něčím dříve zmíněným? | ||
+ | |||
+ | Neboli: Má z daného markable vést někam šipka? Je anaphorem nějakého antecedentu? | ||
Vidím dvě možnosti: | Vidím dvě možnosti: | ||
1) Předřadit modul, který to určí; úspěšnost by však musela být velice vysoká, jinak to považuju za zbytečné snižování celkové úspěšnosti. Nicméně není problém takový modul ve scénáři mít či mít možnost ho tam mít. | 1) Předřadit modul, který to určí; úspěšnost by však musela být velice vysoká, jinak to považuju za zbytečné snižování celkové úspěšnosti. Nicméně není problém takový modul ve scénáři mít či mít možnost ho tam mít. | ||
2) V rankingu určit mez, kterou musí vítězný kandidát překročit, | 2) V rankingu určit mez, kterou musí vítězný kandidát překročit, | ||
+ | |||
==== Kdo budou kandidáti? ==== | ==== Kdo budou kandidáti? ==== | ||
- | Předchozí osobní zájmena a podstatná jména, tedy tytéž markables. Předchozí až do nějaké vzdálenosti nebo všichni až do začátku textu? Respektive přesněji: předchozí diskurzní entity - již existující koreferenční řetězec by měl vystupovat jako jeden kandidát. (Nebudou se tím šířit předchozí chyby?) | + | Předchozí osobní zájmena a podstatná jména, tedy tytéž markables. Předchozí až do nějaké vzdálenosti nebo všichni až do začátku textu? Respektive přesněji: předchozí diskurzní entity - již existující koreferenční řetězec by měl vystupovat jako jeden kandidát. (Nebudou se tím šířit předchozí chyby? |
Narozdíl od některých přístupů bych za antecedent vždy volil nejbližší prvek budoucího koref. řetězce - tzn. i zájmeno může být antecedentem podstatného jména - to je možné právě díky posuzování kandidátů včetně jejich existujícího koref. řetězce. | Narozdíl od některých přístupů bych za antecedent vždy volil nejbližší prvek budoucího koref. řetězce - tzn. i zájmeno může být antecedentem podstatného jména - to je možné právě díky posuzování kandidátů včetně jejich existujícího koref. řetězce. | ||
Line 35: | Line 39: | ||
Co bude ranker posuzovat v jednom kroku? " | Co bude ranker posuzovat v jednom kroku? " | ||
Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, | Další možností je využít už existující koreferenční řetězec - neposuzuju kandidáta samostatně, | ||
+ | |||
Line 49: | Line 54: | ||
=== Linguistic Form === | === Linguistic Form === | ||
- | Sleduje, zda kandidát je vlastní jméno, obecné jméno nebo zájmeno. | + | ** Personal Pronoun ** - je kandidát |
+ | |||
+ | ** Proper Name ** - je kandidát | ||
- | Dále: | + | ** General Name ** - je kandidát obecné jméno? |
- | ** Demonstrative Noun Phrase ** - visí na podstatném jménu anaphoru něco jako " | + | ** Demonstrative Noun Phrase ** - visí na podstatném jménu anaphoru něco jako " |
=== Context === | === Context === |