Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
user:dusek:funktory [2012/07/23 14:52] dusek |
user:dusek:funktory [2012/07/25 17:06] (current) dusek |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| - | ==== Automatická detekce funktorů ==== | + | ====== Automatická detekce funktorů |
| - | === Klasifikátor === | + | ===== Klasifikátor |
| * LibLINEAR, logistic regression | * LibLINEAR, logistic regression | ||
| * kombinace klasifikátorů -- klasifikátorem ? | * kombinace klasifikátorů -- klasifikátorem ? | ||
| - | === Varianty pokusů, featury === | + | ===== Varianty pokusů, featury |
| - | == základní sada == | + | ==== základní sada ==== |
| * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | ||
| - | * uzel sám: form, t_lemma, tag, MorphCat, formém, sempos (+trunc), m_lemma (trunc), afun -- **sempos nelze používat!** | + | * uzel sám: form, t_lemma, tag, MorphCat, formém + split, m_lemma (trunc), afun |
| * aux.rf: aux_forms, aux_m_lemma (trunc) | * aux.rf: aux_forms, aux_m_lemma (trunc) | ||
| * uzel + parent: Order, Distance | * uzel + parent: Order, Distance | ||
| - | * synt. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém | + | * synt. okolí: CoarseTag, form, m_lemma, t_lemma, afun, formém |
| * parent, children, lsibling, rsibling, lsiblings, rsiblings, | * parent, children, lsibling, rsibling, lsiblings, rsiblings, | ||
| - | * children types: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém, počet takových | + | * children types: CoarseTag, form, m_lemma, t_lemma, afun, formém |
| * ACNPD, ACNPDV, V, R, J | * ACNPD, ACNPDV, V, R, J | ||
| - | * topol. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc) | + | * topol. okolí: CoarseTag, form, m_lemma, t_lemma |
| * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | ||
| - | == varianty == | + | ==== varianty ==== |
| + | * s formémem a jeho částmi jako featurami nebo bez | ||
| * s ef. rodiči místo topologických ('' | * s ef. rodiči místo topologických ('' | ||
| * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | ||
| - | * s formémem a jeho částmi jako featurami místo sempos ('' | ||
| * vč. stromové varianty ('' | * vč. stromové varianty ('' | ||
| - | * s formémy a diatezí | + | * diateze |
| - | * dělené podle t-lemmatu ('' | + | * dělené podle t-lemmatu ('' |
| * //nové featury (??)// | * //nové featury (??)// | ||
| * zkusit použít oba formémy :-) | * zkusit použít oba formémy :-) | ||
| - | * nominal (max. 70 featur v selection) + binary | + | * nominal (max. 70 featur v selection) + binary + set-aware |
| - | * zkusit nedělit to | + | * featury z vallexu |
| - | === Výsledky === | + | ==== Výsledky |
| ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
| | fug2-dia_coap-c_fix | 2011-12-01 22:58 | 77.607 | 78.383 | | | fug2-dia_coap-c_fix | 2011-12-01 22:58 | 77.607 | 78.383 | | ||
| + | | fug2-dia_coap-d | 2012-07-24 13:45 | 77.938 | 78.307 | | ||
| + | | fug2-dia_coap-d_set (set-aware) | 2012-07-25 13:08 | 78.034 | 78.357 | | ||
| + | | fug2-vallex | 2012-07-24 13:49 | 79.659 | 80.048 | | ||
| + | | fug2-vallex_all-set (vše set-aware) | 2012-07-25 13:08 | 79.688 | 80.004 | | ||
| + | | fug2-vallex_limited-set (jen vallex set-aware) | 2012-07-25 13:09 | 79.636 | 79.995 | | ||
| + | | fug2-vallex_set (krom vallexu) | 2012-07-25 13:35 | 79.762 | 80.041 | | ||
| - | * TODO: set-aware | + | * proč je feat. selection tak neúčinná ? |
| + | * chce to víc featur ? | ||
| - | == Vysvětlení == | + | ==== Vysvětlení |
| * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu (a je jich pak víc), ostatní jsou spíš horší | * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu (a je jich pak víc), ostatní jsou spíš horší | ||
| * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | ||
| * diathesis tomu pomáhá jenom minimálně, | * diathesis tomu pomáhá jenom minimálně, | ||
| + | * set (set-aware) nemá skoro vliv, někde pomáhá, někde škodí; proč? | ||
| - | == Výsledky na zlatých parsech | + | ==== Výsledky na zlatých parsech |
| - | ^ pokus ^ datum ^ bez feature selection ^ s feature selection | + | ^ jazyk ^ varianta |
| - | | fug, nominal |||| | + | | CS | nosplit |
| - | | fug-base | + | | CS | morph-split | 87.714 | |
| - | | fug-eff | + | | CS | formemes |
| - | | fug-eff_tree | + | | EN | nosplit |
| - | | fug-formeme | + | | EN | morph-split | 80.752 | |
| - | | fug-formeme_tree | + | | EN | formemes |
| - | | fug-tlemma | 2011-10-02 22:49 | 86.466 | 87.881 | | + | |
| - | * omylem získané | + | * vždy zlatá struktura a pravidlové formémy k tomu |
| - | * je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře | + | * české na PDT 2.0 D-Test (trén. na PDT train), anglické |
| + | * bez feature selection | ||
| == Nastavení parametrů == | == Nastavení parametrů == | ||
