Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:dusek:morpho_gen [2011/10/06 16:26] dusek |
user:dusek:morpho_gen [2012/07/30 12:58] (current) dusek |
||
---|---|---|---|
Line 31: | Line 31: | ||
* přímo z t_lemma & formém se dá určit 99% případů | * přímo z t_lemma & formém se dá určit 99% případů | ||
* šlo by mít modely jen pro nejednoznačné případy, pro ostatní je generovat z MorphoLM (a brát první, co přijde) nebo mít uložené ve slovníku a jako fallback až LM | * šlo by mít modely jen pro nejednoznačné případy, pro ostatní je generovat z MorphoLM (a brát první, co přijde) nebo mít uložené ve slovníku a jako fallback až LM | ||
+ | * zřejmě nejde mít jeden velký model, který by ošetřil všechny triviální případy -- bude nutné si udělat pls.gz | ||
* modely: pro každé slovo zvlášť, tj. určení jen těch pár tříd | * modely: pro každé slovo zvlášť, tj. určení jen těch pár tříd | ||
- | |||
=== POSy a generované věci === | === POSy a generované věci === | ||
Line 60: | Line 60: | ||
* **GenerateWordForms -- nutné pročistit**, | * **GenerateWordForms -- nutné pročistit**, | ||
* Vokalizace ? | * Vokalizace ? | ||
+ | |||
+ | ==== Slovesa ==== | ||
+ | * Generování slovesných forem -- jednoduché ML na závorkový zápis | ||
+ | * Výsledky: varianty pokusů: | ||
+ | |||
+ | ^ pokus ^ popis ^ datum ^ accuracy ^ | ||
+ | | verbal | ||
+ | | verbal-person | ||
+ | | verbal-persfeat | ||
+ | | verbal-normalized | ||
+ | | verbal-inf_mod_fix | normalizované pořadí v targetu, sjednocené modály, deontmod + is_modal | ||
+ | | verbal-uni_mod | ||
+ | |||
+ | * Výsledky nejsou úplně porovnatelné, | ||
+ | * aktuálně se používá verbal-uni_mod (proč?) | ||
+ | |||
+ | === TODO === | ||
+ | * nastavit nějak líp cost -- asi menší regularizaci, | ||
+ | * přitom zřejmě chyby budou výjimečné (protože prostor featur je hodně hustý a ke každé chybě bude existovat i správný příklad) | ||
+ | * možná filtrovat nemožné příklady (neshodné aux.rf se zlatými? kolik to bude %?) | ||
+ | * váhy příkladům (čím delší string, tím větší váha :-)) | ||
+ | * opravit nějak generování " | ||
+ |