[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:ptacek:zdenek-pfl070 [2008/04/02 17:47]
ptacek
user:ptacek:zdenek-pfl070 [2008/04/23 15:32]
ptacek
Line 104: Line 104:
  
  
-====== homework2 ====== 
  
-bonito chybne se.RV:  
-<code>[lemma!="se"][tag="VpN.*" & lemma!="být|probíhat|souviset"][lemma="s" & tag="RV.*"]</code> 
  
-bonito chybne se.P + 
-<code>[lemma="se" & word="se"][tag="A...7.*|N...7.*" & lc="[sšz].*"]</code> +====== homework2 ======
-Počet výskytů: 4564+
  
 napsáno česky: nevim napsáno česky: nevim
Line 124: Line 120:
 plus prezentace plus prezentace
  
-**chybné jí.V** jsou vpodstatě všechny ~ 500+ 
 +1. bonito chybne se.RV:  
 +<code>[lemma!="se"][tag="VpN.*" & lemma!="být|probíhat|souviset"][lemma="s" & tag="RV.*"]</code> 
 + 
 +1. bonito chybne se.P 
 +<code>[lemma="se" & word="se"][tag="A...7.*|N...7.*" & lc="[sšz].*"]</code> 
 +Počet výskytů: 4564 
 + 
 +2. **chybné jí.V** jsou vpodstatě všechny ~ 500
 <code>[word="jí" & tag="V.*"][tag!="....4.*"]</code> <code>[word="jí" & tag="V.*"][tag!="....4.*"]</code>
 opačně minimálně našel jsem jen: jí šlehačku opačně minimálně našel jsem jen: jí šlehačku
  
-**chybné Pospíšil.V** ~ 68+3. **chybné Pospíšil.V** ~ 68
 <code>[word="[a-b].*"][word="[A-B].*" & tag="V.*" & lemma!="být"]</code> <code>[word="[a-b].*"][word="[A-B].*" & tag="V.*" & lemma!="být"]</code>
 **chybné Pospíšil.N** ~ 936 **chybné Pospíšil.N** ~ 936
 <code>[word="[A-Z].+[tčžšp]il" & tag="NN.*"][word="se|jsem|si|a"]</code> <code>[word="[A-Z].+[tčžšp]il" & tag="NN.*"][word="se|jsem|si|a"]</code>
  
-**chybná spojka A** ~ 194 amperu, clenu, cislovani seznamu+4. **chybná spojka A** ~ 194 amperu, clenu, cislovani seznamu
 <code>[lc="[0-9]+"][word="A" & tag="J.*"]</code> <code>[lc="[0-9]+"][word="A" & tag="J.*"]</code>
  
-**chybný imperativ** ~ 101 pripadu, kdy vetsinou nekdo slabikuje+5. **chybný imperativ** ~ 101 pripadu, kdy vetsinou nekdo slabikuje
 <code>[word="..." & tag="Vi.*"][word="-"]</code> <code>[word="..." & tag="Vi.*"][word="-"]</code>
  
-**chybné verb místo adjektiva ala 'zelená'**+6. **chybné verb místo adjektiva ala 'zelená'** ~ 352
 <code>[lemma!="se|jak"][word=".*[vln]ená" & tag="V.*" & lemma!="z[ča].*"][lemma!="se"]</code> <code>[lemma!="se|jak"][word=".*[vln]ená" & tag="V.*" & lemma!="z[ča].*"][lemma!="se"]</code>
  
-** nesaturovaná předložka** hypoteza+7. ** ** 
 +<code></code> 
 + 
 +8. ** ** 
 +<code></code> 
 + 
 +9. ** nesaturovaná předložka** ~ 463 vetsinou chybne OCR
 <code>[lemma="s"][tag="N...[13456].*" & word="[a-z].*"]</code> <code>[lemma="s"][tag="N...[13456].*" & word="[a-z].*"]</code>
 +
 +10. **ty** zájmeno osobní ale pritom ukazovaci ~ 17922(!)
 +<code>[word="ty" & tag="PD.*"][tag ="NN.*"]</code>
 +
 +11. **ti** zájmeno osobní ale pritom ukazovaci ~ 2933
 +<code>[word="ti" & tag="PD.*"][tag ="NNMP.*"]</code>
 +
 +12. ** akuzativ za nominativ ** ~ 201
 +<code>[tag="NN..1.*"][lemma="dostat|dovést|držet|houpat|dělat|mít"][tag="NN..1.*"]</code>
 +
 +13. ** vokativ nevokativ** ~ 2449
 +<code>[tag="NN..5.*"][pos!="[ZAP]" & tag!="....5.*"]{5}</code>
 +
 +14. ** dvě fin slovesa moc blízko** ~ 7414
 +<code>[tag="V.*" & tag!="V[esf].*" & lemma!="být|mít|bývat"][tag="V.*" & tag!="V[fism].*" & lemma!="být|mít"]</code>
 +chybí čárky, nebo špatná lematizace
 +
 +15. ** cizí slova jako necizí **
 +<code>[tag="Vi.S...2.*" & lemma!=".*(viz|pocem|t|ci)" & word!=".*[ěščřžýáíéňťď].*"] ~ 59</code>
 +<code>[word="der" & tag="Vi.*"] ~ 21</code>
 +<code>[tag="Vi.*" & word="[a-z]{0,4}" & word!="zmiz|nech|jdi|vem|jdi|ozvi|zkus|spi|mluv|viz|uhni|dej|hni|zlom|urvi|ubal|zvol|uber"] ~ 2778</code>
 +
 +16. ** chyby ve znaceni <s> podle klitik ** ~ 832
 +<code><s>[word="by|mi|ti|se"]</code>
 +
 +17. ** spojky nespoky ** ~ 5947
 +<code>[pos="J" & word=".*o" & lc!="a?nebo|zatímco|zato|jako|co|proto|.*žto"]</code>
 +
 +18. ** chybná segmentace ** ~
 +<code>[pos!="Z"]<s>[word="[a-z]*"]</code>
 +
 +19. ** **
 +<code></code>

[ Back to the navigation ] [ Back to the content ]