[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:zeman:srilm [2009/06/02 12:31]
zeman Výroba jazykového modelu pro hindštinu.
user:zeman:srilm [2009/06/02 12:34] (current)
zeman Výsledek.
Line 82: Line 82:
  
 Tentokrát test běží bez chyb! Tentokrát test běží bez chyb!
 +
  
 ===== Výroba jazykového modelu ===== ===== Výroba jazykového modelu =====
Line 92: Line 93:
     -text data/train.lowercased.hi \     -text data/train.lowercased.hi \
     -lm   lm/train.lowercased.hi.lm</code>     -lm   lm/train.lowercased.hi.lm</code>
 +
 +Pro 50000 hindských vět je to rychlá práce (pár vteřin) i na slabém stroji. Takhle zjistíme, jak velký model vznikl:
 +
 +<code>head -5 lm/train.lowercased.hi.lm
 +
 +\data\
 +ngram 1=67924
 +ngram 2=488352
 +ngram 3=98876</code>

[ Back to the navigation ] [ Back to the content ]