Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:funktory [2011/09/29 15:09] dusek |
user:dusek:funktory [2011/10/04 13:38] dusek |
||
---|---|---|---|
Line 4: | Line 4: | ||
* LibLINEAR, logistic regression | * LibLINEAR, logistic regression | ||
* kombinace klasifikátorů -- klasifikátorem ? | * kombinace klasifikátorů -- klasifikátorem ? | ||
- | |||
=== Varianty pokusů, featury === | === Varianty pokusů, featury === | ||
* vynechané koordinační funktory (měly by se dělat zvlášť) | * vynechané koordinační funktory (měly by se dělat zvlášť) | ||
- | * základní | + | == základní |
- | * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | + | * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) |
- | * uzel sám: form, t_lemma, tag, MorphCat, formém, sempos (+trunc), m_lemma (trunc), afun | + | * uzel sám: form, t_lemma, tag, MorphCat, formém, sempos (+trunc), m_lemma (trunc), afun -- **sempos nelze používat!** |
- | * aux.rf: aux_forms, aux_m_lemma (trunc) | + | * aux.rf: aux_forms, aux_m_lemma (trunc) |
- | * uzel + parent: Order, Distance | + | * uzel + parent: Order, Distance |
- | * synt. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém | + | * synt. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém |
- | * parent, children, lsibling, rsibling, lsiblings, rsiblings, | + | * parent, children, lsibling, rsibling, lsiblings, rsiblings, |
- | * children types: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém, počet takových | + | * children types: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém, počet takových |
- | * ACNPD, ACNPDV, V, R, J | + | * ACNPD, ACNPDV, V, R, J |
- | * topol. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc) | + | * topol. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc) |
- | * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | + | * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 |
+ | |||
+ | == varianty == | ||
* s ef. rodiči místo topologických ('' | * s ef. rodiči místo topologických ('' | ||
* s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | ||
Line 24: | Line 25: | ||
* dělené podle t-lemmatu ('' | * dělené podle t-lemmatu ('' | ||
* //nové featury (??)// | * //nové featury (??)// | ||
+ | * zkusit použít oba formémy :-) | ||
* nominal (max. 70 featur v selection) + binary | * nominal (max. 70 featur v selection) + binary | ||
+ | * zkusit nedělit to | ||
=== Výsledky === | === Výsledky === | ||
Line 30: | Line 33: | ||
^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
| fug, nominal |||| | | fug, nominal |||| | ||
- | | fug-base | 2011-09-27 21:31 | 79.278 | 79.318 | | + | | fug-base | 2011-10-04 05:45 | 79.068 | 79.264 | |
- | | fug-eff | 2011-09-27 21:41 | 79.513 | 79.742 | | + | | fug-eff | 2011-10-04 05:30 | 79.415 | 79.581 | |
- | | fug-eff_tree | 2011-09-27 21:41 | 79.724 | 79.901 | | + | | fug-eff_tree | 2011-10-04 05:10 | 80.139 | 80.524 | |
- | | fug-formeme | 2011-09-29 09:52 | 79.242 | 79.694 | | + | | fug-formeme | 2011-10-04 05:47 | 79.203 | 79.525 | |
- | | fug-tlemma | 2011-09-27 00:21 | 78.605 | 80.019 | | + | | fug-formeme_tree | 2011-10-04 07:40 | 80.005 | 80.368 |
+ | | fug-tlemma | 2011-10-04 03:53 | 78.828 | 80.391 | | ||
| fug2-base | 2011-09-27 20:03 | 79.096 | 79.290 | | | fug2-base | 2011-09-27 20:03 | 79.096 | 79.290 | | ||
| fug2-eff | 2011-09-27 22:03 | 79.471 | 79.612 | | | fug2-eff | 2011-09-27 22:03 | 79.471 | 79.612 | | ||
Line 41: | Line 45: | ||
| fug2-tlemma | 2011-09-27 20:35 | 78.501 | 79.775 | | | fug2-tlemma | 2011-09-27 20:35 | 78.501 | 79.775 | | ||
+ | == vysvětlení == | ||
+ | * 1. vs. 2. verze formémů -- o trošku lepší arg. subst., jiné horší | ||
+ | * u eff_tree jsou lepší všechny až na bez sempos a slovesa | ||
+ | * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu, ostatní jsou spíš horší | ||
+ | * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | ||
+ | * tlemma: v průměru v2 horší, není výrazně zjevné, jaká slova to kazí | ||
+ | == výsledky na zlatých parsech -- bez formémů == | ||
+ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
+ | | fug, nominal |||| | ||
+ | | fug-base | 2011-10-01 18:07 | 87.009 | 87.229 | | ||
+ | | fug-eff | 2011-10-01 17:29 | 88.156 | 88.304 | | ||
+ | | fug-eff_tree | 2011-10-02 03:55 | 89.182 | 89.363 | | ||
+ | | fug-formeme | 2011-10-02 18:43 | 83.129 | 83.477 | | ||
+ | | fug-formeme_tree | 2011-10-02 10:05 | 88.589 | 88.923 | | ||
+ | | fug-tlemma | 2011-10-02 22:49 | 86.466 | 87.881 | | ||
- | + | * omylem získané | |
- | + | * je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře | |
- | + | ||
- | + | ||
- | + | ||