[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Automatické určování koreference

poznámky ke schůzce 29. září

implementace v TectoMT ⇒ můžeme použít existující moduly (analýza případně až na tekto rovinu, nám bude stačit analytická rovina)

segmentace → morfologie → tagging → parsing na analytickou rovinu

Otázka 1: Co budou markables?

Podle mne všechna podstatná jména a všechna osobní zájmena. Přinejmenším zpočátku, pak se to může vylepšovat či rozšiřovat na další zájmena. Řídil bych se především potřebami projektu PlayCoref a tím, co je anotováno v projektu Bridging.

**Otázka 2: Jak poznat

features pro ranking (a jejich váhy) budou různé pro různé typy anaphor (pozná se podle tagu), nejméně tyto tři typy:
- zájmena
- vlastní jména
- ostatní podstatná jména


[ Back to the navigation ] [ Back to the content ]