Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:zeman:brilluv-tagger [2007/10/24 16:59] zeman Model kontextových pravidel. |
user:zeman:brilluv-tagger [2007/11/11 08:57] (current) zeman Trénování pravidel skončilo. |
||
---|---|---|---|
Line 20: | Line 20: | ||
Dělení korpusu je náhodné, ale se snahou, aby obě části byly přibližně stejně velké. Vyšlo mi 34221 vět v první části a 34341 ve druhé. Vzhledem k tomu, že původní korpus měl kolem miliónu slov, každá část by měla mít kolem 500000 slov. | Dělení korpusu je náhodné, ale se snahou, aby obě části byly přibližně stejně velké. Vyšlo mi 34221 vět v první části a 34341 ve druhé. Vzhledem k tomu, že původní korpus měl kolem miliónu slov, každá část by měla mít kolem 500000 slov. | ||
+ | |||
===== Model neznámých slov ===== | ===== Model neznámých slov ===== | ||
Line 39: | Line 40: | ||
<code perl> | <code perl> | ||
+ | |||
+ | Trénování běželo na clusteru 17 dní, ale možná by bylo rychlejší, | ||
**Upozornění: | **Upozornění: |