This is an old revision of the document!
Automatická detekce funktorů
Klasifikátor
- LibLINEAR, logistic regression (upravit ?)
- kombinace klasifikátorů – klasifikátorem ?
- zpětná kontrola, že nemá formém nic, co ho nepotřebuje ?
Varianty pokusů, featury
- vynechané koordinační funktory (beztak nepotřebují formém)
základní
- technické: sent_id, word_id, parent, nodetype, is_generated (+ formeme)
- uzel sám: t_lemma, functor, sempos (+trunc)
- aux.rf: aux_forms, aux_m_lemma (trunc)
- uzel + parent: Order, Distance
- synt. okolí: functor, t_lemma, sempos (trunc)
- parent, children, lsibling, rsibling, lsiblings, rsiblings,
- topol. okolí: t_lemma, sempos (trunc)
- left 3, 2, 2+1, 1, right 1, 1+2, 2, 3
varianty
- s ef. rodiči místo topologických (
eff
) - s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (
eff_tree
) - dělené podle t-lemmatu (
tlemma
) - nové featury (??)
- použít nějak childrentypes (dělit podle sempos-u)?
- nominal (max. 50 featur v selection) + binary
Výsledky
pokus | datum | bez feature selection | s feature selection |
---|---|---|---|
fog, nominal | |||
fog-base | 2011-09-29 03:48 | 84.487 | 85.077 |
fog-eff | 2011-09-29 03:28 | 85.563 | 86.102 |
fog-eff_tree | 2011-09-29 03:22 | 85.928 | 86.485 |
fog-tlemma | 2011-09-29 14:32 | 83.795 | 84.985 |
fog2-base | 2011-09-29 15:10 | 83.465 | 84.020 |
fog2-eff | 2011-09-29 16:00 | 84.433 | 84.982 |
fog2-eff_tree | 2011-09-29 15:28 | 84.955 | 85.504 |
fog2-tlemma | 2011-09-30 02:52 | 82.588 | 83.886 |
komentář
- druhá varianta vychází hůř, ale o méně než 1 %