[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
user:ptacek:zdenek-pfl070 [2007/10/23 10:12]
ptacek vytvořeno
user:ptacek:zdenek-pfl070 [2007/11/10 15:38]
ptacek
Line 1: Line 1:
 +homework2:
 +bonito chybne se.RV: 
 +<code>[lemma!="se"][tag="VpN.*" & lemma!="být|probíhat|souviset"][lemma="s" & tag="RV.*"]</code>
  
- +bonito chybne se.P 
 +<code>[lemma="se" & word="se"][tag="A...7.*|N...7.*" & lc="[sšz].*"]</code> 
 +Počet výskytů: 4564
  
 napsáno česky: nevim napsáno česky: nevim
 mluvena produkce: 10^7 lidi krat 10^7rocne jeden clovek (200slov za minutu, 2h denne mluvi ~ 25.000) mluvena produkce: 10^7 lidi krat 10^7rocne jeden clovek (200slov za minutu, 2h denne mluvi ~ 25.000)
 +
 +homework: milion slov, korpus z jazyka:
 +udelat frekvencni seznam
 +
 +cat text | sed "s/ /\n/g" | grep '[aeiouy'] | grep -v '....' | sort | uniq -c | head 20
 +
 +prvni stranku frekvencniho seznamu pro jazyk 
 +plus prezentace

[ Back to the navigation ] [ Back to the content ]