This is an old revision of the document!
Automatická detekce funktorů
Klasifikátor
- LibLINEAR, logistic regression
- kombinace klasifikátorů – klasifikátorem ?
Varianty pokusů, featury
- vynechané koordinační funktory (měly by se dělat zvlášť)
základní sada
- technické: sent_id, word_id, parent, nodetype, is_generated (+functor)
- uzel sám: form, t_lemma, tag, MorphCat, formém, sempos (+trunc), m_lemma (trunc), afun
- aux.rf: aux_forms, aux_m_lemma (trunc)
- uzel + parent: Order, Distance
- synt. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém
- parent, children, lsibling, rsibling, lsiblings, rsiblings,
- children types: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém, počet takových
- ACNPD, ACNPDV, V, R, J
- topol. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc)
- left 3, 2, 2+1, 1, right 1, 1+2, 2, 3
varianty
- s ef. rodiči místo topologických (
eff
) - s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (
eff_tree
) - s formémem a jeho částmi jako featurami místo sempos (
formeme
) – bude časem default, protože sempos neznám, dokud nemám funktor - dělené podle t-lemmatu (
tlemma
) - nové featury (??)
- nominal (max. 70 featur v selection) + binary
Výsledky
pokus | datum | bez feature selection | s feature selection |
---|---|---|---|
fug, nominal | |||
fug-base | 2011-09-27 21:31 | 79.278 | 79.318 |
fug-eff | 2011-09-27 21:41 | 79.513 | 79.742 |
fug-eff_tree | 2011-09-27 21:41 | 79.724 | 79.901 |
fug-formeme | 2011-09-29 09:52 | 79.242 | 79.694 |
fug-tlemma | 2011-09-27 00:21 | 78.605 | 80.019 |
fug2-base | 2011-09-27 20:03 | 79.096 | 79.290 |
fug2-eff | 2011-09-27 22:03 | 79.471 | 79.612 |
fug2-eff_tree | 2011-09-28 03:49 | 79.727 | 79.860 |
fug2-formeme | 2011-09-29 08:04 | 78.989 | 79.308 |
fug2-tlemma | 2011-09-27 20:35 | 78.501 | 79.775 |