Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:dusek:vystadial:flect [2013/01/11 12:04] dusek |
user:dusek:vystadial:flect [2013/01/29 11:14] (current) dusek |
||
---|---|---|---|
Line 55: | Line 55: | ||
* Tol taky radši = 0.001 nebo 0.0001 | * Tol taky radši = 0.001 nebo 0.0001 | ||
* Na L2 / L1 druhu regularizace zřejmě moc nezávisí | * Na L2 / L1 druhu regularizace zřejmě moc nezávisí | ||
+ | * Rozpětí 96.92 - 94.01, naprostá většina nad 96.5 | ||
+ | * L2 regularizace tvoří nechutně velké modely, L1 jsou mnooohem menší | ||
+ | |||
+ | train-l2_1000_001.py.o6633181: | ||
+ | train-l1_100_0001.py.o6633154: | ||
+ | train-l1_100_00001.py.o6633155: | ||
+ | train-l1_10_0001.py.o6633150: | ||
+ | train-l1_10_00001.py.o6633151: | ||
+ | |||
+ | ** Použití SVM ** | ||
+ | * Lineární SVM -- trvá dýl trénování, | ||
+ | * hlavně s L2 je dlouhé. | ||
+ | |||
+ | train-l1_l2_1_False_0001.py.o6636505: | ||
+ | train-l2_l2_1_False_0001.py.o6636541: | ||
+ | train-l2_l2_10_False_0001.py.o6636544: | ||
+ | train-l1_l2_1_False_00001.py.o6636506: | ||
+ | |||
+ | * Normální SVC s 16G paměti spadne | ||
+ | * S 32G to doběhne, ale s mizivým výsledkem | ||
+ | |||
+ | ** Zkrácení sufixů a filtrace ** | ||
+ | |||
+ | * Bez použití teček se prodlouží trénování, | ||
+ | * Pokud se sufixy zkrátí na 4 znaky, funguje to dobře -- ale jen bez filtrování; | ||
+ | * Bez filtrování to funguje dobře | ||
+ | |||
+ | ** Nové experimenty, | ||
+ | |||
+ | * Na auto-python max. 93.6, na gold 97.8. | ||
+ | * Stačí 4 znaky ze suffixu, nepřítomnost lemmatu to moc nezhoršuje. | ||
+ | * Na OOV-gold lemma: 92.3, OOV-forms: 89.2 | ||
+ | * U OOV-forms je vidět, že hrozně chyb9 lepší featury, protože to často dostává relativně vhodné formy, ale špatný pád/ | ||
+ | |||
+ | ** Složené featury ** | ||
+ | |||
+ | * Na gold 99.4 | ||
+ | |||
+ | |||
+ | ** SVM ** | ||
+ | |||
+ | * při použití vah instancí se v pohodě natrénují, |