[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:dusek:morpho_gen [2011/12/08 14:13]
dusek
user:dusek:morpho_gen [2012/07/30 12:58] (current)
dusek
Line 63: Line 63:
 ==== Slovesa ==== ==== Slovesa ====
   * Generování slovesných forem -- jednoduché ML na závorkový zápis   * Generování slovesných forem -- jednoduché ML na závorkový zápis
-  * nutné určitco bude vyjadřovat co ... +  * Výsledky: varianty pokusů: 
-    * je možné "přegenerovat" morphcat (dát tam víc, než je potřeba?)+ 
 +^ pokus              ^ popis                                                                             ^ datum            ^ accuracy ^ 
 +| verbal             | původní variantapřímo lemmata modálních sloves v targetu, bez featury pro osobu | 2011-12-08 18:48 | 94.641   | 
 +| verbal-person      | s featurou "person" a navíc osobou uvedenou v targetu                             | 2011-12-14 18:56 | 94.085   | 
 +| verbal-persfeat    | s featurou "person"                                                               | 2011-12-22 12:41 | 94.952   | 
 +| verbal-normalized  | normalizované pořadí v targetu, sjednocené modály, jen deontmod                   | 2012-01-27 17:09 | 96.954   | 
 +| verbal-inf_mod_fix | normalizované pořadí v targetu, sjednocené modály, deontmod + is_modal            | 2012-02-01 17:49 | 96.976   | 
 +| verbal-uni_mod     | normalizované pořadí v targetu, sjednocené modály, jen is_modal                   | 2012-02-03 14:57 | 96.942   | 
 + 
 +  Výsledky nejsou úplně porovnatelné, původní verbal má jiné testovací instance (ale jen o trošku), navíc množina target values je pokaždé jiná! 
 +  * aktuálně se používá verbal-uni_mod (proč?) 
 + 
 +=== TODO === 
 +  * nastavit nějak líp cost -- asi menší regularizaci, víc overtrainingaby se i řídké příklady zohlednily 
 +    * přitom zřejmě chyby budou výjimečné (protože prostor featur je hodně hustý a ke každé chybě bude existovat i správný příklad) 
 +  * možná filtrovat nemožné příklady (neshodné aux.rf se zlatými? kolik to bude %?) 
 +  * váhy příkladům (čím delší string, tím větší váha :-)) 
 +  * opravit nějak generování "by/bychom" 

[ Back to the navigation ] [ Back to the content ]