Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:funktory [2011/10/04 13:38] dusek |
user:dusek:funktory [2011/10/27 11:38] dusek |
||
---|---|---|---|
Line 6: | Line 6: | ||
=== Varianty pokusů, featury === | === Varianty pokusů, featury === | ||
- | * vynechané koordinační funktory (měly by se dělat zvlášť) | + | |
== základní sada == | == základní sada == | ||
* technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | * technické: sent_id, word_id, parent, nodetype, is_generated (+functor) | ||
Line 22: | Line 22: | ||
* s ef. rodiči místo topologických ('' | * s ef. rodiči místo topologických ('' | ||
* s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami ('' | ||
- | * s formémem a jeho částmi jako featurami místo sempos ('' | + | * s formémem a jeho částmi jako featurami místo sempos ('' |
+ | * vč. stromové varianty ('' | ||
+ | * s formémy a diatezí ('' | ||
* dělené podle t-lemmatu ('' | * dělené podle t-lemmatu ('' | ||
* //nové featury (??)// | * //nové featury (??)// | ||
Line 38: | Line 40: | ||
| fug-formeme | 2011-10-04 05:47 | 79.203 | 79.525 | | | fug-formeme | 2011-10-04 05:47 | 79.203 | 79.525 | | ||
| fug-formeme_tree | 2011-10-04 07:40 | 80.005 | 80.368 | | | fug-formeme_tree | 2011-10-04 07:40 | 80.005 | 80.368 | | ||
+ | | fug-dia | 2011-10-07 03:49 | 79.214 | 79.525 | | ||
+ | | fug-dia_tree | 2011-10-07 03:18 | 80.026 | 80.368 | | ||
| fug-tlemma | 2011-10-04 03:53 | 78.828 | 80.391 | | | fug-tlemma | 2011-10-04 03:53 | 78.828 | 80.391 | | ||
- | | fug2-base | 2011-09-27 20:03 | 79.096 | 79.290 | | + | | fug1-base | 2011-10-05 11:44 | 79.043 | 79.305 | |
- | | fug2-eff | 2011-09-27 22:03 | 79.471 | 79.612 | | + | | fug1-eff | 2011-10-05 11:41 | 79.398 | 79.638 | |
- | | fug2-eff_tree | 2011-09-28 03:49 | 79.727 | 79.860 | | + | | fug1-eff_tree | 2011-10-05 11:23 | 80.126 | 80.509 | |
- | | fug2-formeme | + | | fug1-formeme | 2011-10-05 14:12 | 78.976 | 79.268 | |
- | | fug2-tlemma | 2011-09-27 20:35 | 78.501 | 79.775 | | + | | fug1-formeme_tree | 2011-10-05 |
+ | | fug1-dia | 2011-10-06 23:51 | 78.989 | 79.270 | | ||
+ | | fug1-dia_tree | 2011-10-07 | ||
+ | | fug1-tlemma | 2011-10-05 00:41 | 78.846 | 80.400 | | ||
+ | | fug2-base | 2011-10-05 10:43 | 79.001 | ||
+ | | fug2-eff | 2011-10-05 01:27 | 79.357 | 79.507 | | ||
+ | | fug2-eff_tree | 2011-10-05 09:31 | 80.102 | 80.443 | | ||
+ | | *fug2-formeme | 2011-10-20 01:08 | 78.831 | ||
+ | | *fug2-formeme_tree | 2011-10-20 01:44 | 79.748 | 80.100 | ||
+ | | *fug2-dia | 2011-10-19 22:41 | 78.836 | 79.188 | | ||
+ | | *fug2-dia_tree | 2011-10-19 22:57 | 79.735 | 80.129 | ||
+ | | fug2-tlemma | 2011-10-05 07:43 | 78.838 | 80.209 | | ||
- | == vysvětlení == | + | * * = Opravená verze 2. formémů (opět trošku snižuje úspěšnost :-( ) |
- | * 1. vs. 2. verze formémů -- o trošku lepší arg. subst., jiné horší | + | |
- | * u eff_tree jsou lepší všechny až na bez sempos a slovesa | + | == Vysvětlení == |
- | * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu, ostatní jsou spíš horší | + | * 1. vs. 2. verze formémů -- 2. verze dopadá v průměru o chlup hůř |
+ | * není problémem n:X ? | ||
+ | * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu | ||
* protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace) | ||
+ | * diathesis tomu pomáhá jenom minimálně, | ||
* tlemma: v průměru v2 horší, není výrazně zjevné, jaká slova to kazí | * tlemma: v průměru v2 horší, není výrazně zjevné, jaká slova to kazí | ||
- | == výsledky | + | == Výsledky |
^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ | ||
Line 66: | Line 84: | ||
* je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře | * je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře | ||
+ | == Nastavení parametrů == | ||
+ | |||
+ | * Bez feature selection vychází nejlíp: | ||
+ | ^ typ ^ cost ^ term. criterion ^ | ||
+ | | adj | 1 / 2 | 0.1 | | ||
+ | | adv | 1 | 0.03 | | ||
+ | | v, n | 1 | 0.01 | | ||
+ | | ??? | 1 | 0.1 | | ||
+ | | - | 1 | 0.003 / 0.03 | | ||
+ | |||
+ | == Poučení == | ||
+ | |||
+ | * Nezapomínat na binarizaci, jinak to celé bude mít mizernou úspěšnost (65%) | ||
+ | * Pozor na overtraining, | ||
+ | |||
+ | === Koordinační funktory === | ||
+ | * Je potřeba udělat, protože přesnost pravidel není valná (mají jen asi 4 možné funktory) | ||
+ | * FixIsMember je asi vhodný, ale ne úplně nutný: v praxi zřejmě nedojde k tomu, aby koordinační funktor dostalo něco, co předtím nebyla koordinace, a naopak. |