[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:pecina:mt-exp [2012/09/26 12:29]
pecina
user:pecina:mt-exp [2012/09/26 12:35]
pecina
Line 41: Line 41:
   * data od JH jsou zde: ''/net/data/all-czech-words-2012/allforms.gz''   * data od JH jsou zde: ''/net/data/all-czech-words-2012/allforms.gz''
   * generovací tabulka je prozatim zde: ''/net/cluster/TMP/pecina/mt-exp/generation.1,2-0.gz''   * generovací tabulka je prozatim zde: ''/net/cluster/TMP/pecina/mt-exp/generation.1,2-0.gz''
-  * Vznikla  takto: ''zcat /net/data/all-czech-words-2012/allforms.gz| uconv -f iso-8859-2 -t utf8 | ./gen_table.pl | gzip > generation.1,2-0.gz''+  * Vznikla  takto: ''zcat /net/data/all-czech-words-2012/allforms.gz | uconv -f iso-8859-2 -t utf8 | ./gen_table.pl | gzip > generation.1,2-0.gz''
   * dopředná podmíněná pravděpodobnost je vždy 1, zpětná je uniformní dle skutečného stavu.   * dopředná podmíněná pravděpodobnost je vždy 1, zpětná je uniformní dle skutečného stavu.
   * Je možné ji filtrovat tak, že se odstraní nespisovné výrazy, případně vlastní jména (viz řádek 16 a 17 v ''gen_table.pl'').   * Je možné ji filtrovat tak, že se odstraní nespisovné výrazy, případně vlastní jména (viz řádek 16 a 17 v ''gen_table.pl'').
   * Tabulka bez nespisovných výrazů je zde: ''generation-no-coloq.1,2-0.gz''   * Tabulka bez nespisovných výrazů je zde: ''generation-no-coloq.1,2-0.gz''

[ Back to the navigation ] [ Back to the content ]