Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:morpho_gen [2011/10/03 17:26] dusek |
user:dusek:morpho_gen [2011/10/04 17:11] dusek |
||
---|---|---|---|
Line 16: | Line 16: | ||
* Jeden model na všechny POSy? Spíš asi dělené, na různá políčka různý, určování zleva doprava | * Jeden model na všechny POSy? Spíš asi dělené, na různá políčka různý, určování zleva doprava | ||
* časem může být použit interset | * časem může být použit interset | ||
- | | + | * zřejmě |
- | | + | |
- | * hodí se, že první blok už bude mít rody všech substantiv doplněné | + | - doplnění konstant |
+ | - určení jednotlivých morfologických hodnot | ||
+ | * hodí se, že první blok už bude mít rody všech substantiv doplněné | ||
+ | |||
+ | == určení slovního druhu == | ||
+ | * SubPOS podle č. morfologie | ||
+ | * vynechat slovesné formy -- bude se určovat čas | ||
+ | * vynechat vokalizaci předložek, | ||
+ | * v podstatě dost závislé na slovníku, až na některé případy -- možná pokud bude jednoznačné ze slovníku, určit podle něj (možná by stačily featury jako rod subst., možné tagy apod. -- model se slovníkem by byl trochu fuj; nebo jen filtrovaný slovník) | ||
+ | * ale modely trénovat globálně, v závislosti na první části formému (?) | ||
=== POSy a generované věci === | === POSy a generované věci === | ||
Line 25: | Line 34: | ||
* adjektiva: číslo, negace, rod, pád (pokud není dán z formému) | * adjektiva: číslo, negace, rod, pád (pokud není dán z formému) | ||
* zájmena: číslo, negace, rod, pád (není-li dán z formému), possesivnost (v určení lemmatu? -- //svůj// apod.) | * zájmena: číslo, negace, rod, pád (není-li dán z formému), possesivnost (v určení lemmatu? -- //svůj// apod.) | ||
- | * číslovky: pád (není-li z formému) | + | * číslovky: pád (není-li z formému), rod (není-li konstantní) |
* možná až potom dát ReverseNounNumberDependendency, | * možná až potom dát ReverseNounNumberDependendency, | ||
* slovesa: osoba, číslo, čas, rod (v tagu samotném), modální sloveso | * slovesa: osoba, číslo, čas, rod (v tagu samotném), modální sloveso | ||
+ | * předložky: | ||
=== Potřebné featury === | === Potřebné featury === | ||
Line 39: | Line 49: | ||
* Reflexiva tantum, Subconjs, DropSubjPersProns (?), MoveCliticsToWackernagel, | * Reflexiva tantum, Subconjs, DropSubjPersProns (?), MoveCliticsToWackernagel, | ||
* AddPrepos, AddParentheses, | * AddPrepos, AddParentheses, | ||
- | * GenerateWordForms -- nutné pročistit, je v tom bordel | + | |
+ | * Vokalizace ? |