Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
user:zeman:brilluv-tagger [2007/10/24 16:59] zeman Model kontextových pravidel. |
user:zeman:brilluv-tagger [2007/11/11 08:57] (current) zeman Trénování pravidel skončilo. |
||
|---|---|---|---|
| Line 20: | Line 20: | ||
| Dělení korpusu je náhodné, ale se snahou, aby obě části byly přibližně stejně velké. Vyšlo mi 34221 vět v první části a 34341 ve druhé. Vzhledem k tomu, že původní korpus měl kolem miliónu slov, každá část by měla mít kolem 500000 slov. | Dělení korpusu je náhodné, ale se snahou, aby obě části byly přibližně stejně velké. Vyšlo mi 34221 vět v první části a 34341 ve druhé. Vzhledem k tomu, že původní korpus měl kolem miliónu slov, každá část by měla mít kolem 500000 slov. | ||
| + | |||
| ===== Model neznámých slov ===== | ===== Model neznámých slov ===== | ||
| Line 39: | Line 40: | ||
| <code perl> | <code perl> | ||
| + | |||
| + | Trénování běželo na clusteru 17 dní, ale možná by bylo rychlejší, | ||
| **Upozornění: | **Upozornění: | ||
