[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:morpho_gen [2011/12/08 14:13]
dusek
user:dusek:morpho_gen [2012/07/26 16:01]
dusek
Line 63: Line 63:
 ==== Slovesa ==== ==== Slovesa ====
   * Generování slovesných forem -- jednoduché ML na závorkový zápis   * Generování slovesných forem -- jednoduché ML na závorkový zápis
-  * nutné určitco bude vyjadřovat co ... +  * Výsledky: varianty pokusů: 
-    * je možné "egenerovat" morphcat (dát tam víc, než je potřeba?)+ 
 +^ pokus              ^ popis                                                                             ^ datum            ^ accuracy ^ 
 +| verbal             | původní variantapřímo lemmata modálních sloves v targetu, bez featury pro osobu | 2011-12-08 18:48 | 94.641   | 
 +| verbal-person      | s featurou "person" a navíc osobou uvedenou v targetu                             | 2011-12-14 18:56 | 94.085   | 
 +| verbal-persfeat    | s featurou "person"                                                               | 2011-12-22 12:41 | 94.952   | 
 +| verbal-normalized  | normalizované pořadí v targetu, sjednocené modály, jen deontmod                   | 2012-01-27 17:09 | 94.952   | 
 +| verbal-inf_mod_fix | normalizované pořadí v targetu, sjednocené modály, deontmod + is_modal            | 2012-02-01 17:49 | 96.976   | 
 +| verbal-uni_mod     | normalizované pořadí v targetu, sjednocené modály, jen is_modal                   | 2012-02-03 14:57 | 96.942   | 
 + 
 +  Výsledky nejsou úplně porovnatelné, původní verbal má jiné testovací instance (ale jen o trošku), navíc množina target values je pokaždé jiná! 
 + 
 +=== TODO === 
 +  * nastavit nějak líp cost -- asi menší regularizaci, víc overtraining, aby se i řídké íklady zohlednily 
 +    * přitom zřejmě chyby budou výjimečné (protože prostor featur je hodně hustý a ke každé chybě bude existovat i správný příklad) 
 +  * možná filtrovat nemožné příklady (neshodné aux.rf se zlatými? kolik to bude %?) 
 +  * váhy příkladům (čím delší string, tím větší váha :-)) 
 +  * opravit nějak generování "by/bychom" 

[ Back to the navigation ] [ Back to the content ]