Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:malt-parser [2010/04/02 14:55] zeman Pětitisícové úseky. |
user:zeman:malt-parser [2010/04/02 16:10] zeman Java 35000. |
||
---|---|---|---|
Line 105: | Line 105: | ||
Joakim navrhuje, abychom zkusili dělení zjemnit, např. místo CPOSTAGu dělit modely podle slovního poddruhu (druhá pozice české značky). Pak by dílčí modely byly menší a libsvm by třeba nespadlo. Ve skutečnosti budu asi muset zjemňovat jiným způsobem, protože právě u podstatných jmen žádné zvláštní dělení na poddruhy neexistuje. Mohly by ale pomoct pády. | Joakim navrhuje, abychom zkusili dělení zjemnit, např. místo CPOSTAGu dělit modely podle slovního poddruhu (druhá pozice české značky). Pak by dílčí modely byly menší a libsvm by třeba nespadlo. Ve skutečnosti budu asi muset zjemňovat jiným způsobem, protože právě u podstatných jmen žádné zvláštní dělení na poddruhy neexistuje. Mohly by ale pomoct pády. | ||
+ | |||
Line 120: | Line 121: | ||
| 25000 | 1011455 | 10:59 h | 6964 s = 1:56 h | 1 věta / 0,75 s | 80,32 % | | | | 25000 | 1011455 | 10:59 h | 6964 s = 1:56 h | 1 věta / 0,75 s | 80,32 % | | | ||
| 30000 | 1011456 | | | | | Nerozeběhlo se. | | | 30000 | 1011456 | | | | | Nerozeběhlo se. | | ||
- | | 35000 | 1011457 | | | | | | | + | | 35000 | 1011457 | 22:33 h | 9230 s = 2:34 h | 1 věta / 1,00 s | 81,03 % | | |
| 40000 | 1011458 | | | | | | | | 40000 | 1011458 | | | | | | | ||
| 45000 | 1011459 | | | | | | | | 45000 | 1011459 | | | | | | | ||
Line 127: | Line 128: | ||
| 60000 | 1011462 | | | | | | | | 60000 | 1011462 | | | | | | | ||
| 65000 | 1011463 | | | | | | | | 65000 | 1011463 | | | | | | | ||
+ | |||
Line 146: | Line 148: | ||
| 60000-64999 | 1021437 | | | | 76,81 % | | | | 60000-64999 | 1021437 | | | | 76,81 % | | | ||
| 65000-68562 | 1021438 | | | | 75,86 % | | | | 65000-68562 | 1021438 | | | | 75,86 % | | | ||
+ | |||
+ | Všechny díly se nakonec podařilo použít, čímž jsme definitivně vyvrátili, že by v& | ||
+ | |||
+ | Zarážející je ale úspěšnost. Přinejmenším pro první pětitisícový úsek měla být s& | ||
==== Co dál? ==== | ==== Co dál? ==== |