Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:funktory [2012/07/23 11:09] dusek |
user:dusek:funktory [2012/07/23 15:00] dusek |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ==== Automatická detekce funktorů ==== | + | ====== Automatická detekce funktorů |
- | === Klasifikátor === | + | ===== Klasifikátor |
* LibLINEAR, logistic regression | * LibLINEAR, logistic regression | ||
* kombinace klasifikátorů -- klasifikátorem ? | * kombinace klasifikátorů -- klasifikátorem ? | ||
- | === Varianty pokusů, featury === | + | ===== Varianty pokusů, featury |
- | == základní sada == | + | ==== základní sada ==== |
* technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | ||
* uzel sám: form, t_lemma, tag, MorphCat, formém, sempos (+trunc), m_lemma (trunc), afun -- **sempos nelze používat!** | * uzel sám: form, t_lemma, tag, MorphCat, formém, sempos (+trunc), m_lemma (trunc), afun -- **sempos nelze používat!** | ||
Line 19: | Line 19: | ||
* left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | ||
- | == varianty == | + | ==== varianty |
* s ef. rodiči místo topologických ('' | * s ef. rodiči místo topologických ('' | ||
* s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | ||
Line 25: | Line 25: | ||
* vč. stromové varianty ('' | * vč. stromové varianty ('' | ||
* s formémy a diatezí ('' | * s formémy a diatezí ('' | ||
- | * dělené podle t-lemmatu ('' | + | * dělené podle t-lemmatu ('' |
* //nové featury (??)// | * //nové featury (??)// | ||
* zkusit použít oba formémy :-) | * zkusit použít oba formémy :-) | ||
- | * nominal (max. 70 featur v selection) + binary | + | * nominal (max. 70 featur v selection) + binary + set-aware |
- | * zkusit nedělit to | + | * featury z vallexu |
- | === Výsledky === | + | ==== Výsledky |
^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
| fug2-dia_coap-c_fix | 2011-12-01 22:58 | 77.607 | 78.383 | | | fug2-dia_coap-c_fix | 2011-12-01 22:58 | 77.607 | 78.383 | | ||
+ | * TODO: set-aware | ||
- | == Vysvětlení == | + | ==== Vysvětlení |
* eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu (a je jich pak víc), ostatní jsou spíš horší | * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu (a je jich pak víc), ostatní jsou spíš horší | ||
* protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | ||
* diathesis tomu pomáhá jenom minimálně, | * diathesis tomu pomáhá jenom minimálně, | ||
- | == Výsledky na zlatých parsech | + | ==== Výsledky na zlatých parsech |
- | ^ pokus ^ datum ^ bez feature selection ^ s feature selection | + | ^ jazyk ^ varianta |
- | | fug, nominal |||| | + | | CS | nosplit |
- | | fug-base | + | | CS | morph-split | 87.714 | |
- | | fug-eff | + | | CS | formemes |
- | | fug-eff_tree | + | | EN | nosplit |
- | | fug-formeme | + | | EN | morph-split | 80.752 | |
- | | fug-formeme_tree | + | | EN | formemes |
- | | fug-tlemma | 2011-10-02 22:49 | 86.466 | 87.881 | | + | |
- | * omylem získané | + | * vždy zlatá struktura a pravidlové formémy k tomu |
- | * je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře | + | * české na PDT 2.0 D-Test (trén. na PDT train), anglické |
+ | * bez feature selection | ||
== Nastavení parametrů == | == Nastavení parametrů == |