[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:ptacek:zdenek-pfl070 [2007/11/11 00:46]
ptacek
user:ptacek:zdenek-pfl070 [2008/04/23 08:50]
ptacek
Line 1: Line 1:
 ====== homework1 ====== ====== homework1 ======
  
- 8827 да+   8827 да
    8046 мен    8046 мен
    7475 бұл    7475 бұл
Line 103: Line 103:
  
  
-====== homework2 ====== 
  
-bonito chybne se.RV:  
-<code>[lemma!="se"][tag="VpN.*" & lemma!="být|probíhat|souviset"][lemma="s" & tag="RV.*"]</code> 
  
-bonito chybne se.P +====== homework2 ======
-<code>[lemma="se" & word="se"][tag="A...7.*|N...7.*" & lc="[sšz].*"]</code> +
-Počet výskytů: 4564+
  
 napsáno česky: nevim napsáno česky: nevim
Line 122: Line 117:
 prvni stranku frekvencniho seznamu pro jazyk  prvni stranku frekvencniho seznamu pro jazyk 
 plus prezentace plus prezentace
 +
 +
 +1. bonito chybne se.RV: 
 +<code>[lemma!="se"][tag="VpN.*" & lemma!="být|probíhat|souviset"][lemma="s" & tag="RV.*"]</code>
 +
 +1. bonito chybne se.P
 +<code>[lemma="se" & word="se"][tag="A...7.*|N...7.*" & lc="[sšz].*"]</code>
 +Počet výskytů: 4564
 +
 +2. **chybné jí.V** jsou vpodstatě všechny ~ 500
 +<code>[word="jí" & tag="V.*"][tag!="....4.*"]</code>
 +opačně minimálně našel jsem jen: jí šlehačku
 +
 +3. **chybné Pospíšil.V** ~ 68
 +<code>[word="[a-b].*"][word="[A-B].*" & tag="V.*" & lemma!="být"]</code>
 +**chybné Pospíšil.N** ~ 936
 +<code>[word="[A-Z].+[tčžšp]il" & tag="NN.*"][word="se|jsem|si|a"]</code>
 +
 +4. **chybná spojka A** ~ 194 amperu, clenu, cislovani seznamu
 +<code>[lc="[0-9]+"][word="A" & tag="J.*"]</code>
 +
 +5. **chybný imperativ** ~ 101 pripadu, kdy vetsinou nekdo slabikuje
 +<code>[word="..." & tag="Vi.*"][word="-"]</code>
 +
 +6. **chybné verb místo adjektiva ala 'zelená'** ~ 352
 +<code>[lemma!="se|jak"][word=".*[vln]ená" & tag="V.*" & lemma!="z[ča].*"][lemma!="se"]</code>
 +
 +7. ** **
 +<code></code>
 +
 +8. ** **
 +<code></code>
 +
 +9. ** nesaturovaná předložka** ~ 463 vetsinou chybne OCR
 +<code>[lemma="s"][tag="N...[13456].*" & word="[a-z].*"]</code>
 +
 +10. **ty** zájmeno osobní ale pritom ukazovaci ~ 17922(!)
 +<code>[word="ty" & tag="PD.*"][tag ="NN.*"]</code>
 +
 +11. **ti** zájmeno osobní ale pritom ukazovaci ~ 2933
 +<code>[word="ti" & tag="PD.*"][tag ="NNMP.*"]</code>
 +
 +12. ** **
 +<code></code>
 +
 +13. ** **
 +<code></code>
 +
 +14. ** **
 +<code></code>
 +
 +15. ** **
 +<code></code>
 +
 +16. ** **
 +<code></code>
 +
 +17. ** **
 +<code></code>
 +
 +18. ** **
 +<code></code>
 +
 +19. ** **
 +<code></code>

[ Back to the navigation ] [ Back to the content ]