Soutěž SDP 2015 (bude na SemEvalu, zatím se neví kde).
Stephan chce identifikátory rámců do nového sloupce SENSE. Neřekl, kde by byl, já bych ho dal za dosavadní sloupce TOP a PRED. Sloupec PRED by měl opět boolovské hodnoty jako loni. SENSE může být vyplněn i pro uzel, který nemá děti. Hotovo.
Ruší se přípony “-obl” a “-opt”. Bude jen jedna přípona “-arg”, která tvůrcům systémů říká, co budeme vyhodnocovat, když budeme zjišťovat, zda trefili celý výskyt rámce. Hotovo.
Pět vnitřních doplnění (core arguments: ACT, PAT, ADDR, ORIG, EFF) by tuto příponu mělo dostat vždy. Dokonce i když se vyskytnou pod neslovesným uzlem, který nemá rámec. Abychom zbytečně nerozšiřovali množinu značek. Budou ji mít i v případě, že jsou v rámci uvedená jako volitelná (vyskytl se třeba volitelný PAT). Hotovo.
Volná doplnění (všechna kromě těch pěti výše uvedených) dostanou příponu “-arg” pouze pokud byla uvedena v rámci, a to jako povinná (někdy se totiž v rámcích objevují i doplnění, která nejsou vnitřní ani povinná, ale přesto jsou pro dané sloveso typická a autoři slovníku si je tam chtěli uvést pro lepší orientaci). Hotovo.
K cyklům by se mohlo přistoupit jinak, než popisuju v článku na tom příkladu se zdvojeným slovesem “regulate”. Tam zřejmě mažu přímo generovaný uzel. Mohl bych ale také promítnout všechny hrany, detekovat cyklus a pak už jen umazat nějakou hranu, aby zmizel cyklus, ale ostatní hrany z generovaného uzlu by tam mohly zůstat.
Kromě toho mi bylo dohodnuto, že bychom mohli zavést další potenciálně cyklovatou věc. Pokud jsou ve stromech koreferenční šipky, můžou z nich vzniknout další hrany. Ne vždy přímočaře, že by se šipka stala hranou. Příklad byl se slovesy kontroly, např. něco jako “Peter ordered John to go home.” John bude PAT od “ordered”, pak tam bude generovaný uzel, který bude ACT od “go”, a z tohoto generovaného uzlu povede koreferenční šipka k Johnovi. My vygenerovaný uzel vyhodíme, ale nejdříve vyvodíme, že John je současně také ACT od “go”, a přidáme tomu odpovídající hranu. Pokud by tím ale někde vzniknul cyklus, tak to neuděláme.
Dodat česká data.
Vylepšit tektogramatický parser, abychom se příště mohli zúčastnit s lepším systémem.