Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:funktory [2011/09/29 16:19] dusek |
user:dusek:funktory [2012/07/23 11:09] dusek |
||
---|---|---|---|
Line 4: | Line 4: | ||
* LibLINEAR, logistic regression | * LibLINEAR, logistic regression | ||
* kombinace klasifikátorů -- klasifikátorem ? | * kombinace klasifikátorů -- klasifikátorem ? | ||
- | |||
=== Varianty pokusů, featury === | === Varianty pokusů, featury === | ||
- | * vynechané koordinační funktory (měly by se dělat zvlášť) | + | |
== základní sada == | == základní sada == | ||
* technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | ||
Line 19: | Line 18: | ||
* topol. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc) | * topol. okolí: CoarseTag, form, m_lemma, t_lemma, sempos (trunc) | ||
* left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | * left 3, 2, 2+1, 1, right 1, 1+2, 2, 3 | ||
+ | |||
== varianty == | == varianty == | ||
* s ef. rodiči místo topologických ('' | * s ef. rodiči místo topologických ('' | ||
* s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | ||
- | * s formémem a jeho částmi jako featurami místo sempos ('' | + | * s formémem a jeho částmi jako featurami místo sempos ('' |
+ | * vč. stromové varianty ('' | ||
+ | * s formémy a diatezí ('' | ||
* dělené podle t-lemmatu ('' | * dělené podle t-lemmatu ('' | ||
* //nové featury (??)// | * //nové featury (??)// | ||
+ | * zkusit použít oba formémy :-) | ||
* nominal (max. 70 featur v selection) + binary | * nominal (max. 70 featur v selection) + binary | ||
+ | * zkusit nedělit to | ||
+ | |||
=== Výsledky === | === Výsledky === | ||
+ | |||
+ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
+ | | fug2-dia_coap-c_fix | 2011-12-01 22:58 | 77.607 | 78.383 | | ||
+ | |||
+ | |||
+ | == Vysvětlení == | ||
+ | * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu (a je jich pak víc), ostatní jsou spíš horší | ||
+ | * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | ||
+ | * diathesis tomu pomáhá jenom minimálně, | ||
+ | |||
+ | == Výsledky na zlatých parsech -- bez formémů == | ||
^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
| fug, nominal |||| | | fug, nominal |||| | ||
- | | fug-base | 2011-09-27 21:31 | 79.278 | 79.318 | | + | | fug-base | 2011-10-01 18:07 | 87.009 | 87.229 | |
- | | fug-eff | 2011-09-27 21:41 | 79.513 | 79.742 | | + | | fug-eff | 2011-10-01 17:29 | 88.156 | 88.304 | |
- | | fug-eff_tree | 2011-09-27 21:41 | 79.724 | 79.901 | | + | | fug-eff_tree | 2011-10-02 03:55 | 89.182 | 89.363 | |
- | | fug-formeme | 2011-09-29 09:52 | 79.242 | 79.694 | | + | | fug-formeme | 2011-10-02 18:43 | 83.129 | 83.477 | |
- | | fug-tlemma | + | | fug-formeme_tree |
- | | fug2-base | 2011-09-27 20:03 | 79.096 | 79.290 | | + | | fug-tlemma |
- | | fug2-eff | + | |
- | | fug2-eff_tree | + | * omylem získané |
- | | fug2-formeme | + | * je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře |
- | | fug2-tlemma | + | |
+ | == Nastavení parametrů == | ||
+ | |||
+ | * Bez feature selection vychází nejlíp: | ||
+ | |||
+ | ^ typ ^ cost ^ term. criterion ^ | ||
+ | | adj | 1 / 2 | 0.1 | | ||
+ | | adv | 1 | 0.03 | | ||
+ | | v, n | 1 | 0.01 | | ||
+ | | ??? | 1 | 0.1 | | ||
+ | | - | 1 | 0.003 / 0.03 | | ||
+ | |||
+ | == Poučení == | ||
+ | |||
+ | * Nezapomínat na binarizaci, jinak to celé bude mít mizernou úspěšnost (65%) | ||
+ | * Pozor na overtraining, | ||
+ | * Pozor na data, ať v nich není nic, co je známé až potom | ||
+ | |||
+ | === Koordinační funktory === | ||
- | == vysvětlení == | + | * Je potřeba udělat, protože přesnost pravidel není valná (mají jen asi 4 možné funktory) |
- | * 2. verze funktorů dává o 1% lepší substantiva, ale mnohem horší adverbia -- proč ? | + | * FixIsMember je asi vhodný, ale ne úplně nutný: v praxi zřejmě nedojde k tomu, aby koordinační funktor dostalo něco, co předtím nebyla koordinace, a naopak. |