Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:formemy_gen [2011/09/29 14:50] dusek vytvořeno |
user:dusek:formemy_gen [2011/10/04 18:30] dusek |
||
---|---|---|---|
Line 4: | Line 4: | ||
* LibLINEAR, logistic regression (upravit ?) | * LibLINEAR, logistic regression (upravit ?) | ||
* kombinace klasifikátorů -- klasifikátorem ? | * kombinace klasifikátorů -- klasifikátorem ? | ||
+ | * zpětná kontrola, že nemá formém nic, co ho nepotřebuje ? | ||
=== Varianty pokusů, featury === | === Varianty pokusů, featury === | ||
* vynechané koordinační funktory (beztak nepotřebují formém) | * vynechané koordinační funktory (beztak nepotřebují formém) | ||
- | * základní ('' | + | == základní |
+ | * technické: sent_id, word_id, parent, nodetype, is_generated | ||
+ | * uzel sám: t_lemma, functor, sempos (+trunc) | ||
+ | * aux.rf: aux_forms, aux_m_lemma (trunc) | ||
+ | * uzel + parent: Order, Distance | ||
+ | * synt. okolí: functor, t_lemma, sempos (trunc) | ||
+ | * parent, children, lsibling, rsibling, lsiblings, rsiblings, | ||
+ | * topol. okolí: t_lemma, sempos (trunc) | ||
+ | * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | ||
+ | == varianty == | ||
* s ef. rodiči místo topologických ('' | * s ef. rodiči místo topologických ('' | ||
* s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | ||
* dělené podle t-lemmatu ('' | * dělené podle t-lemmatu ('' | ||
* //nové featury (??)// | * //nové featury (??)// | ||
+ | * použít nějak childrentypes (dělit podle sempos-u)? | ||
* nominal (max. 50 featur v selection) + binary | * nominal (max. 50 featur v selection) + binary | ||
+ | * vyházet z trénovacích dat příklady s formémy n:X !! | ||
=== Výsledky === | === Výsledky === | ||
Line 22: | Line 34: | ||
| fog-eff_tree | 2011-09-29 03:22 | 85.928 | 86.485 | | | fog-eff_tree | 2011-09-29 03:22 | 85.928 | 86.485 | | ||
| fog-tlemma | 2011-09-29 14:32 | 83.795 | 84.985 | | | fog-tlemma | 2011-09-29 14:32 | 83.795 | 84.985 | | ||
+ | | fog2-base | 2011-09-29 15:10 | 83.465 | 84.020 | | ||
+ | | fog2-eff | 2011-09-29 16:00 | 84.433 | 84.982 | | ||
+ | | fog2-eff_tree | 2011-09-29 15:28 | 84.955 | 85.504 | | ||
+ | | fog2-tlemma | 2011-09-30 02:52 | 82.588 | 83.886 | | ||
+ | == komentář == | ||
+ | * druhá varianta vychází hůř, ale o méně než 1 % | ||
+ | * nejvíc příkladů je pro: RSTR, PAT, ACT, PRED, APP, LOC, TWHEN, PREC, ???, RHEM, MANN, EXT, (EFF, ADDR, DIR3, DIR1, ID, MAT) | ||
+ | * 2. verze (base) | ||
+ | * RSTR: n:1, n:X vs. n:attr (přes 200), n:X vs. n:1 (není moc chyba), n:1 vs. adj:attr -- defaultováním na 1. pád by se dalo řešit hodně | ||
+ | * PAT: n:1 vs. n:4 (přes 500), n:2 vs. n:4, n:4 vs. n:1 (přes 100) -- zas tak hrozné není; n:na+4 vs. n:4, n:3 vs. n:4 (oba přes 100, horší) | ||
+ | * ACT: n:4 vs. n:1, n:X vs. n:1, n:2 vs. n:1 -- vše v pohodě | ||
- | + | == podle funktorů == | |
- | + | * ACMP -- musí být dělení bez / s !!! | |
- | + | * ACT -- n:4 vs. n:1, n:X vs. n:1 -- OK | |
- | + | * AIM -- na předložkách moc nezáleží -- OK (zkontrolovat lemma!) | |
- | + | * BEN + proti ??, jinak n:3 vs. n:pro+4 -- OK | |
- | + | * CAUS + n:za+4 ??, řídká data (možná bude třeba nějak vylepšit) | |
+ | * CNCS -- chce určitě i_když !!! (jinak to nemá cenu), jinak je to úplně jedno -- OK | ||
+ | * COMPL -- formémy v.2 to ničí, protože ve v.1 je tam adj:compl (a kazí to n:4 vs. n:1) | ||
+ | * COND -- nepřehazuje n: a v:, proto celkem OK, složené spojky nutné -- OK | ||
+ | * CPHR -- kazí to adj:compl u v.2, jinak -- OK | ||
+ | * CPR -- řídké -- OK | ||
+ | * CRIT -- vede " | ||
+ | * DENOM -- u v.2 trochu víc bordelu s pády -- OK | ||
+ | * DIFF -- v.2 opravou číslovek boduje -- OK | ||
+ | * DIR1 -- v.2 převodem adj -> n boduje -- OK | ||
+ | * DIR2 -- problém, je tam moc různých předložek, | ||
+ | * DIR3 -- asi by pomohlo lemma, na x do je docela potíž !!! | ||
+ | * | ||