Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:malt-parser [2010/04/09 10:57] zeman V noci spadla síť, zbývající pokusy pouštím znova. |
user:zeman:malt-parser [2010/04/12 10:40] zeman Doběhla java 35000 trénink. |
||
---|---|---|---|
Line 105: | Line 105: | ||
Joakim navrhuje, abychom zkusili dělení zjemnit, např. místo CPOSTAGu dělit modely podle slovního poddruhu (druhá pozice české značky). Pak by dílčí modely byly menší a libsvm by třeba nespadlo. Ve skutečnosti budu asi muset zjemňovat jiným způsobem, protože právě u podstatných jmen žádné zvláštní dělení na poddruhy neexistuje. Mohly by ale pomoct pády. | Joakim navrhuje, abychom zkusili dělení zjemnit, např. místo CPOSTAGu dělit modely podle slovního poddruhu (druhá pozice české značky). Pak by dílčí modely byly menší a libsvm by třeba nespadlo. Ve skutečnosti budu asi muset zjemňovat jiným způsobem, protože právě u podstatných jmen žádné zvláštní dělení na poddruhy neexistuje. Mohly by ale pomoct pády. | ||
+ | |||
Line 114: | Line 115: | ||
==== Javová implementace libsvm ==== | ==== Javová implementace libsvm ==== | ||
- | Předpokládá se, že vyžaduje více času a paměti. Podle dokumentace může dojít i k& | + | Předpokládá se, že vyžaduje více času a paměti. Podle dokumentace může dojít i k& |
- | + | ||
- | | N | Úloha | Délka trénování | Délka parsingu | Rychlost parsingu | Úspěšnost | Poznámka | | + | |
- | | 1000 | 1011450 | 37 s | | | | Spadlo, kód -1 není v& | + | |
- | | 2000 | 1011451 | 2:46 min | 661 s = 11 min | 1 věta / 0,07 s | 74,10 % | | | + | |
- | | 5000 | 1011452 | 17:45 min | 1527 s = 25 min | 1 věta / 0,16 s | 76,65 % | | | + | |
- | | 10000 | 1011453 | | | | | Nerozeběhlo se. | | + | |
- | | 20000 | 1011454 | 6:23 h | 5602 s = 1:33 h | 1 věta / 0,60 s | 79,90 % | | | + | |
- | | 25000 | 1011455 | 10:59 h | 6964 s = 1:56 h | 1 věta / 0,75 s | 80,32 % | | | + | |
- | | 30000 | 1011456 | | | | | Nerozeběhlo se. | | + | |
- | | 35000 | 1011457 | 22:33 h | 9230 s = 2:34 h | 1 věta / 1,00 s | 81,03 % | | | + | |
- | | 40000 | 1011458 | 36:36 h | 12484 s = 3:28 h | 1 věta / 1,35 s | 81,17 % | | | + | |
- | | 45000 | 1011459 | 46:26 h | 13889 s = 3:51 h | 1 věta / 1,50 s | 81,51 % | | | + | |
- | | 50000 | 1011460 | 58:13 h | 15711 s = 4:22 h | 1 věta / 1,69 s | 81,72 % | | | + | |
- | | 55000 | 1011461 | 65:48 h | 17031 s = 4:44 h | 1 věta / 1,84 s | 81,83 % | | | + | |
- | | 60000 | 1011462 | 90:10 h | 18145 s = 5:02 h | 1 věta / 1,96 s | 82,11 % | | | + | |
- | | 65000 | 1011463 | 89:29 h | 15808 s = 4:23 h | 1 věta / 1,71 s | 82,31 % | | | + | |
- | + | ||
- | === Oprava 6.4.2010 === | + | |
- | + | ||
- | Předcházející pokusy s& | + | |
| N | Úloha | Délka trénování | Délka parsingu | Rychlost parsingu | Úspěšnost | Poznámka | | | N | Úloha | Délka trénování | Délka parsingu | Rychlost parsingu | Úspěšnost | Poznámka | | ||
Line 144: | Line 125: | ||
| 25000 | 1032122 | 27:43 h | 16500 s = 4:35 h | 1 věta / 1,78 s | 84,24 % | 6.-8.4.2010 | | | 25000 | 1032122 | 27:43 h | 16500 s = 4:35 h | 1 věta / 1,78 s | 84,24 % | 6.-8.4.2010 | | ||
| 30000 | 1032123 | 47:21 h | 24255 s = 6:44 h | 1 věta / 2,62 s | 84,54 % | 6.-8.4.2010 | | | 30000 | 1032123 | 47:21 h | 24255 s = 6:44 h | 1 věta / 2,62 s | 84,54 % | 6.-8.4.2010 | | ||
- | | 35000 | 1035249 | | | | | 9.4.2010 | | + | | 35000 | 1035249 | 2 dny 11:08 h | | | | 9.-12.4.2010 | |
| 40000 | 1035250 | | | | | 9.4.2010 | | | 40000 | 1035250 | | | | | 9.4.2010 | | ||
| 45000 | 1035251 | | | | | 9.4.2010 | | | 45000 | 1035251 | | | | | 9.4.2010 | | ||
Line 151: | Line 132: | ||
| 60000 | 1035254 | | | | | 9.4.2010 | | | 60000 | 1035254 | | | | | 9.4.2010 | | ||
| 65000 | 1035255 | | | | | 9.4.2010 | | | 65000 | 1035255 | | | | | 9.4.2010 | | ||
- | |||
- | |||
- | |||
==== Trénovací data rozsekaná na pětitisícové úseky ==== | ==== Trénovací data rozsekaná na pětitisícové úseky ==== |