Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:morpho_gen [2011/09/29 14:20] dusek vytvořeno |
user:dusek:morpho_gen [2011/10/03 16:54] dusek |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ==== Generování morfologických atributů z formémů a gramatémů ==== | + | ==== Generování morfologických atributů z formémů a gramatémů |
=== Postup === | === Postup === | ||
* Nejdřív určit MainPOS a SubPOS, podle toho se budou určovat další featury | * Nejdřív určit MainPOS a SubPOS, podle toho se budou určovat další featury | ||
* Určit i Lemma, na základě zdrojového lemmatu (důležité hlavně pro #PersPron, ale i possesiva nebo cokoliv by se sbalovalo na t-rovině) | * Určit i Lemma, na základě zdrojového lemmatu (důležité hlavně pro #PersPron, ale i possesiva nebo cokoliv by se sbalovalo na t-rovině) | ||
+ | * lemma se mění na t-rovině u: #PersPron, possesiv, (číslovek, | ||
* něco obecnějšího na složené slovesné formy | * něco obecnějšího na složené slovesné formy | ||
+ | * do autom. skládání stromu z formémů (až po vygenerování všech funkcí) | ||
+ | * možná mít celou složenou formu jako celek a dávat jí nejdřív jeden tag (?) | ||
=== Modely === | === Modely === | ||
* Jeden model na všechny POSy? Spíš asi dělené, na různá políčka různý, určování zleva doprava | * Jeden model na všechny POSy? Spíš asi dělené, na různá políčka různý, určování zleva doprava | ||
+ | * časem může být použit interset | ||
+ | * nejprve doplnit konstantní vlastnosti, potom určování ostatních i na základně nich | ||
+ | * zřejmě dva bloky -- jeden pro určení slovního druhu a doplnění konstant, druhý pro určení jednotlivých morfologických hodnot | ||
=== POSy a generované věci === | === POSy a generované věci === | ||
* drop -- přidá se k vyhození, negeneruje se nic | * drop -- přidá se k vyhození, negeneruje se nic | ||
- | * | + | * substantiva: |
+ | * adjektiva: číslo, negace, rod, pád (pokud není dán z formému) | ||
+ | * zájmena: číslo, negace, rod, pád (není-li dán z formému), possesivnost (v určení lemmatu? -- //svůj// apod.) | ||
+ | * číslovky: pád (není-li z formému) | ||
+ | * možná až potom dát ReverseNounNumberDependendency, | ||
=== Potřebné featury === | === Potřebné featury === | ||
+ | * IsSubject -- MarkSubject, | ||
+ | * z+2, featury od toho, co na tom visí //pro adjektiva: " | ||
+ | * Koreference (gramatická) //pro " | ||
+ | * rodič a jeho featury //pro adjektiva: governors gender// | ||
=== Zůstává ruční / původní === | === Zůstává ruční / původní === | ||
- | + | | |
- | * Reflexiva tantum, Subconjs, DropSubjPersProns (?), MoveCliticsToWackernagel, | + | * AddPrepos, AddParentheses, |
- | * AddPrepos, AddParentheses, | + | * GenerateWordForms -- nutné pročistit, je v tom bordel |