[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:morpho_gen [2011/10/05 18:57]
dusek
user:dusek:morpho_gen [2011/12/08 14:13]
dusek
Line 29: Line 29:
   * vynechat vokalizaci předložek, bude se určovat zvlášť   * vynechat vokalizaci předložek, bude se určovat zvlášť
   * u většiny slov jednoznačné, je pár složitých, nejhorší je #PersPron   * u většiny slov jednoznačné, je pár složitých, nejhorší je #PersPron
 +    * přímo z t_lemma & formém se dá určit 99% případů
     * šlo by mít modely jen pro nejednoznačné případy, pro ostatní je generovat z MorphoLM (a brát první, co přijde) nebo mít uložené ve slovníku a jako fallback až LM     * šlo by mít modely jen pro nejednoznačné případy, pro ostatní je generovat z MorphoLM (a brát první, co přijde) nebo mít uložené ve slovníku a jako fallback až LM
-    * modely: pro každé slovo zvlášť, tj. určení jen těch pár tříd, možná přímo z t_lemma & formém by se dalo, nebo ještě nějaké další podrobnosti+      * zřejmě nejde mít jeden velký model, který by ošetřil všechny triviální případy -- bude nutné si udělat pls.gz 
 +    * modely: pro každé slovo zvlášť, tj. určení jen těch pár tříd
  
 === POSy a generované věci === === POSy a generované věci ===
Line 58: Line 60:
   * **GenerateWordForms -- nutné pročistit**, je v tom bordel   * **GenerateWordForms -- nutné pročistit**, je v tom bordel
   * Vokalizace ?   * Vokalizace ?
 +
 +==== Slovesa ====
 +  * Generování slovesných forem -- jednoduché ML na závorkový zápis
 +  * nutné určit, co bude vyjadřovat co ...
 +    * je možné "přegenerovat" morphcat (dát tam víc, než je potřeba?)

[ Back to the navigation ] [ Back to the content ]