Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:dusek:vystadial:flect [2012/12/06 16:24] dusek |
user:dusek:vystadial:flect [2013/01/29 11:14] (current) dusek |
||
---|---|---|---|
Line 4: | Line 4: | ||
2012-11-27 09: | 2012-11-27 09: | ||
2012-11-27 09: | 2012-11-27 09: | ||
- | / | + | / |
- | f = msb / msw | + | |
2012-11-27 09: | 2012-11-27 09: | ||
2012-11-27 09: | 2012-11-27 09: | ||
Line 20: | Line 19: | ||
* 6.12.2012 | * 6.12.2012 | ||
* acc. 0.9779 | * acc. 0.9779 | ||
+ | |||
+ | |||
+ | ** Přeprogramování trénování ** | ||
+ | |||
+ | 2012-12-18 11: | ||
+ | 2012-12-18 11: | ||
+ | 2012-12-18 11: | ||
+ | / | ||
+ | 2012-12-18 11: | ||
+ | 2012-12-18 17: | ||
+ | 2012-12-18 17: | ||
+ | 2012-12-18 17: | ||
+ | 2012-12-18 17: | ||
+ | 2012-12-18 17: | ||
+ | |||
+ | |||
+ | ** Trénování na datech vyprodukovaných v pythonu ** | ||
+ | |||
+ | andromeda2: | ||
+ | 2013-01-04 13: | ||
+ | 2013-01-04 13: | ||
+ | 2013-01-04 13: | ||
+ | / | ||
+ | 2013-01-04 13: | ||
+ | 2013-01-05 00: | ||
+ | 2013-01-05 00: | ||
+ | 2013-01-05 00: | ||
+ | 2013-01-05 00: | ||
+ | 2013-01-05 00: | ||
+ | |||
+ | ** Výsledky pro různé parametry logreg ** | ||
+ | |||
+ | * Nepomáhá příliš malé C = 0.1, ani příliš malé tol = 0.1 | ||
+ | * Spíš ani C = 1 není nic moc, C = 10 nebo 100 je mnohem lepší | ||
+ | * Tol taky radši = 0.001 nebo 0.0001 | ||
+ | * Na L2 / L1 druhu regularizace zřejmě moc nezávisí | ||
+ | * Rozpětí 96.92 - 94.01, naprostá většina nad 96.5 | ||
+ | * L2 regularizace tvoří nechutně velké modely, L1 jsou mnooohem menší | ||
+ | |||
+ | train-l2_1000_001.py.o6633181: | ||
+ | train-l1_100_0001.py.o6633154: | ||
+ | train-l1_100_00001.py.o6633155: | ||
+ | train-l1_10_0001.py.o6633150: | ||
+ | train-l1_10_00001.py.o6633151: | ||
+ | |||
+ | ** Použití SVM ** | ||
+ | * Lineární SVM -- trvá dýl trénování, | ||
+ | * hlavně s L2 je dlouhé. | ||
+ | |||
+ | train-l1_l2_1_False_0001.py.o6636505: | ||
+ | train-l2_l2_1_False_0001.py.o6636541: | ||
+ | train-l2_l2_10_False_0001.py.o6636544: | ||
+ | train-l1_l2_1_False_00001.py.o6636506: | ||
+ | |||
+ | * Normální SVC s 16G paměti spadne | ||
+ | * S 32G to doběhne, ale s mizivým výsledkem | ||
+ | |||
+ | ** Zkrácení sufixů a filtrace ** | ||
+ | |||
+ | * Bez použití teček se prodlouží trénování, | ||
+ | * Pokud se sufixy zkrátí na 4 znaky, funguje to dobře -- ale jen bez filtrování; | ||
+ | * Bez filtrování to funguje dobře | ||
+ | |||
+ | ** Nové experimenty, | ||
+ | |||
+ | * Na auto-python max. 93.6, na gold 97.8. | ||
+ | * Stačí 4 znaky ze suffixu, nepřítomnost lemmatu to moc nezhoršuje. | ||
+ | * Na OOV-gold lemma: 92.3, OOV-forms: 89.2 | ||
+ | * U OOV-forms je vidět, že hrozně chyb9 lepší featury, protože to často dostává relativně vhodné formy, ale špatný pád/ | ||
+ | |||
+ | ** Složené featury ** | ||
+ | |||
+ | * Na gold 99.4 | ||
+ | |||
+ | |||
+ | ** SVM ** | ||
+ | |||
+ | * při použití vah instancí se v pohodě natrénují, |
[ Back to the navigation ] [ Back to the content ]