[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:formemy_gen [2011/09/29 15:28]
dusek
user:dusek:formemy_gen [2011/10/04 18:30]
dusek
Line 8: Line 8:
 === Varianty pokusů, featury === === Varianty pokusů, featury ===
   * vynechané koordinační funktory (beztak nepotřebují formém)   * vynechané koordinační funktory (beztak nepotřebují formém)
-  * základní (''base''):+== základní == 
 +  * technické: sent_id, word_id, parent, nodetype, is_generated (+ formeme) 
 +  * uzel sámt_lemma, functor, sempos (+trunc) 
 +  * aux.rf: aux_forms, aux_m_lemma (trunc) 
 +  * uzel + parent: Order, Distance 
 +  * synt. okolí: functor, t_lemma, sempos (trunc) 
 +    * parent, children, lsibling, rsibling, lsiblings, rsiblings,  
 +  * topol. okolí: t_lemma, sempos (trunc) 
 +    * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 
 +== varianty ==
   * s ef. rodiči místo topologických (''eff'')   * s ef. rodiči místo topologických (''eff'')
   * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (''eff_tree'')   * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (''eff_tree'')
   * dělené podle t-lemmatu (''tlemma'')   * dělené podle t-lemmatu (''tlemma'')
   * //nové featury (??)//   * //nové featury (??)//
 +    * použít nějak childrentypes (dělit podle sempos-u)?
   * nominal (max. 50 featur v selection) + binary   * nominal (max. 50 featur v selection) + binary
 +  * vyházet z trénovacích dat příklady s formémy n:X !!
  
 === Výsledky === === Výsledky ===
Line 23: Line 34:
 | fog-eff_tree | 2011-09-29 03:22 | 85.928 | 86.485 | | fog-eff_tree | 2011-09-29 03:22 | 85.928 | 86.485 |
 | fog-tlemma | 2011-09-29 14:32 | 83.795 | 84.985 | | fog-tlemma | 2011-09-29 14:32 | 83.795 | 84.985 |
 +| fog2-base | 2011-09-29 15:10 | 83.465 | 84.020 |
 +| fog2-eff | 2011-09-29 16:00 | 84.433 | 84.982 |
 +| fog2-eff_tree | 2011-09-29 15:28 | 84.955 | 85.504 |
 +| fog2-tlemma | 2011-09-30 02:52 | 82.588 | 83.886 |
  
 +== komentář ==
 +  * druhá varianta vychází hůř, ale o méně než 1 %
 +  * nejvíc příkladů je pro: RSTR, PAT, ACT, PRED, APP, LOC, TWHEN, PREC, ???, RHEM, MANN, EXT, (EFF, ADDR, DIR3, DIR1, ID, MAT)
 +  * 2. verze (base)
 +    * RSTR: n:1, n:X vs. n:attr (přes 200), n:X vs. n:1 (není moc chyba), n:1 vs. adj:attr -- defaultováním na 1. pád by se dalo řešit hodně
 +    * PAT: n:1 vs. n:4 (přes 500), n:2 vs. n:4, n:4 vs. n:1 (přes 100) -- zas tak hrozné není; n:na+4 vs. n:4, n:3 vs. n:4 (oba přes 100, horší)
 +    * ACT: n:4 vs. n:1, n:X vs. n:1, n:2 vs. n:1 -- vše v pohodě
  
- +== podle funktorů == 
- +  * ACMP -- musí být dělení bez / s !!! 
- +  * ACT -- n:4 vs. n:1, n:X vs. n:1 -- OK 
- +  * AIM -- na předložkách moc nezáleží -- OK (zkontrolovat lemma!) 
- +  * BEN + proti ??, jinak n:3 vs. n:pro+4 -- OK 
- +  * CAUS + n:za+4 ??, řídká data (možná bude třeba nějak vylepšit) 
 +  * CNCS -- chce určitě i_když !!! (jinak to nemá cenu), jinak je to úplně jedno -- OK 
 +  * COMPL -- formémy v.2 to ničí, protože ve v.1 je tam adj:compl (a kazí to n:4 vs. n:1) 
 +  * COND -- nepřehazuje n: a v:, proto celkem OK, složené spojky nutné -- OK 
 +  * CPHR -- kazí to adj:compl u v.2, jinak -- OK 
 +  * CPR -- řídké -- OK 
 +  * CRIT -- vede "podle", víceméně OK 
 +  * DENOM -- u v.2 trochu víc bordelu s pády -- OK 
 +  * DIFF -- v.2 opravou číslovek boduje -- OK 
 +  * DIR1 -- v.2 převodem adj -> n boduje -- OK 
 +  * DIR2 -- problém, je tam moc různých předložek, řídké !!! 
 +  * DIR3 -- asi by pomohlo lemma, na x do je docela potíž !!! 
 +  * 
  
  
  

[ Back to the navigation ] [ Back to the content ]