Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
user:dusek:funktory [2012/07/23 14:58] dusek |
user:dusek:funktory [2012/07/25 17:06] (current) dusek |
||
|---|---|---|---|
| Line 9: | Line 9: | ||
| ==== základní sada ==== | ==== základní sada ==== | ||
| * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | ||
| - | * uzel sám: form, t_lemma, tag, MorphCat, formém, sempos (+trunc), m_lemma (trunc), afun -- **sempos nelze používat!** | + | * uzel sám: form, t_lemma, tag, MorphCat, formém + split, m_lemma (trunc), afun |
| * aux.rf: aux_forms, aux_m_lemma (trunc) | * aux.rf: aux_forms, aux_m_lemma (trunc) | ||
| * uzel + parent: Order, Distance | * uzel + parent: Order, Distance | ||
| - | * synt. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém | + | * synt. okolí: CoarseTag, form, m_lemma, t_lemma, afun, formém |
| * parent, children, lsibling, rsibling, lsiblings, rsiblings, | * parent, children, lsibling, rsibling, lsiblings, rsiblings, | ||
| - | * children types: CoarseTag, form, m_lemma, t_lemma, sempos (trunc), afun, formém, počet takových | + | * children types: CoarseTag, form, m_lemma, t_lemma, afun, formém |
| * ACNPD, ACNPDV, V, R, J | * ACNPD, ACNPDV, V, R, J | ||
| - | * topol. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc) | + | * topol. okolí: CoarseTag, form, m_lemma, t_lemma |
| * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | ||
| ==== varianty ==== | ==== varianty ==== | ||
| + | * s formémem a jeho částmi jako featurami nebo bez | ||
| * s ef. rodiči místo topologických ('' | * s ef. rodiči místo topologických ('' | ||
| * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | ||
| - | * s formémem a jeho částmi jako featurami místo sempos ('' | ||
| * vč. stromové varianty ('' | * vč. stromové varianty ('' | ||
| - | * s formémy a diatezí | + | * diateze |
| - | * dělené podle t-lemmatu ('' | + | * dělené podle t-lemmatu ('' |
| * //nové featury (??)// | * //nové featury (??)// | ||
| * zkusit použít oba formémy :-) | * zkusit použít oba formémy :-) | ||
| - | * nominal (max. 70 featur v selection) + binary | + | * nominal (max. 70 featur v selection) + binary + set-aware |
| - | * zkusit nedělit to | + | * featury z vallexu |
| ==== Výsledky ==== | ==== Výsledky ==== | ||
| Line 35: | Line 35: | ||
| ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
| | fug2-dia_coap-c_fix | 2011-12-01 22:58 | 77.607 | 78.383 | | | fug2-dia_coap-c_fix | 2011-12-01 22:58 | 77.607 | 78.383 | | ||
| + | | fug2-dia_coap-d | 2012-07-24 13:45 | 77.938 | 78.307 | | ||
| + | | fug2-dia_coap-d_set (set-aware) | 2012-07-25 13:08 | 78.034 | 78.357 | | ||
| + | | fug2-vallex | 2012-07-24 13:49 | 79.659 | 80.048 | | ||
| + | | fug2-vallex_all-set (vše set-aware) | 2012-07-25 13:08 | 79.688 | 80.004 | | ||
| + | | fug2-vallex_limited-set (jen vallex set-aware) | 2012-07-25 13:09 | 79.636 | 79.995 | | ||
| + | | fug2-vallex_set (krom vallexu) | 2012-07-25 13:35 | 79.762 | 80.041 | | ||
| - | * TODO: set-aware | + | * proč je feat. selection tak neúčinná ? |
| + | * chce to víc featur ? | ||
| ==== Vysvětlení ==== | ==== Vysvětlení ==== | ||
| Line 42: | Line 49: | ||
| * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | ||
| * diathesis tomu pomáhá jenom minimálně, | * diathesis tomu pomáhá jenom minimálně, | ||
| + | * set (set-aware) nemá skoro vliv, někde pomáhá, někde škodí; proč? | ||
| ==== Výsledky na zlatých parsech ==== | ==== Výsledky na zlatých parsech ==== | ||
| Line 55: | Line 63: | ||
| * vždy zlatá struktura a pravidlové formémy k tomu | * vždy zlatá struktura a pravidlové formémy k tomu | ||
| * české na PDT 2.0 D-Test (trén. na PDT train), anglické na PCEDT 2.0 sec. 24 (trén. na 02-21) | * české na PDT 2.0 D-Test (trén. na PDT train), anglické na PCEDT 2.0 sec. 24 (trén. na 02-21) | ||
| + | * bez feature selection | ||
| == Nastavení parametrů == | == Nastavení parametrů == | ||
