This is an old revision of the document!
Automatické určování koreference
poznámky ke schůzce 29. září
implementace v TectoMT ⇒ můžeme použít existující moduly (analýza případně až na tekto rovinu, nám bude stačit analytická rovina)
segmentace → morfologie → tagging → parsing na analytickou rovinu
Otázka 1: Co budou markables?
Podle mne všechna podstatná jména a všechna osobní zájmena. Přinejmenším zpočátku, pak se to může vylepšovat či rozšiřovat na další zájmena. Řídil bych se především potřebami projektu PlayCoref a tím, co je anotováno v projektu Bridging.
**Otázka 2: Jak poznat
features pro ranking (a jejich váhy) budou různé pro různé typy anaphor (pozná se podle tagu), nejméně tyto tři typy:
- zájmena
- vlastní jména
- ostatní podstatná jména