[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:formemy_gen [2011/09/29 15:28]
dusek
user:dusek:formemy_gen [2011/10/04 17:32]
dusek
Line 8: Line 8:
 === Varianty pokusů, featury === === Varianty pokusů, featury ===
   * vynechané koordinační funktory (beztak nepotřebují formém)   * vynechané koordinační funktory (beztak nepotřebují formém)
-  * základní (''base''):+== základní == 
 +  * technické: sent_id, word_id, parent, nodetype, is_generated (+ formeme) 
 +  * uzel sámt_lemma, functor, sempos (+trunc) 
 +  * aux.rf: aux_forms, aux_m_lemma (trunc) 
 +  * uzel + parent: Order, Distance 
 +  * synt. okolí: functor, t_lemma, sempos (trunc) 
 +    * parent, children, lsibling, rsibling, lsiblings, rsiblings,  
 +  * topol. okolí: t_lemma, sempos (trunc) 
 +    * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 
 +== varianty ==
   * s ef. rodiči místo topologických (''eff'')   * s ef. rodiči místo topologických (''eff'')
   * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (''eff_tree'')   * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (''eff_tree'')
   * dělené podle t-lemmatu (''tlemma'')   * dělené podle t-lemmatu (''tlemma'')
   * //nové featury (??)//   * //nové featury (??)//
 +    * použít nějak childrentypes (dělit podle sempos-u)?
   * nominal (max. 50 featur v selection) + binary   * nominal (max. 50 featur v selection) + binary
  
Line 23: Line 33:
 | fog-eff_tree | 2011-09-29 03:22 | 85.928 | 86.485 | | fog-eff_tree | 2011-09-29 03:22 | 85.928 | 86.485 |
 | fog-tlemma | 2011-09-29 14:32 | 83.795 | 84.985 | | fog-tlemma | 2011-09-29 14:32 | 83.795 | 84.985 |
 +| fog2-base | 2011-09-29 15:10 | 83.465 | 84.020 |
 +| fog2-eff | 2011-09-29 16:00 | 84.433 | 84.982 |
 +| fog2-eff_tree | 2011-09-29 15:28 | 84.955 | 85.504 |
 +| fog2-tlemma | 2011-09-30 02:52 | 82.588 | 83.886 |
  
- +== komentář == 
 +  * druhá varianta vychází hůř, ale o méně než 1 % 
 +  * nejvíc příkladů je pro: RSTR, PAT, ACT, PRED, APP, LOC, TWHEN, PREC, ???, RHEM, MANN, EXT, (EFF, ADDR, DIR3, DIR1, ID, MAT) 
 +  * 2. verze (base) 
 +    * RSTR: n:1, n:X vs. n:attr (přes 200), n:X vs. n:1 (není moc chyba), n:1 vs. adj:attr -- defaultováním na 1. pád by se dalo řešit hodně 
 +    * PAT: n:1 vs. n:4 (přes 500), n:2 vs. n:4, n:4 vs. n:1 (přes 100) -- zas tak hrozné není; n:na+4 vs. n:4, n:3 vs. n:4 (oba přes 100, horší) 
 +    * ACT: n:4 vs. n:1, n:X vs. n:1, n:2 vs. n:1 -- vše v pohodě 
 +    * 
  
  

[ Back to the navigation ] [ Back to the content ]