[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:ukoly:hranice-slov-a-vet [2007/10/17 18:44]
zeman Drobná úprava.
user:zeman:ukoly:hranice-slov-a-vet [2007/10/27 19:02]
zeman Portugalská data.
Line 62: Line 62:
   - Typografické uvozovky se nepoužívají ve všech jazycích stejně a stojí za zvážení, zda je neřešit rovněž učením z dat. Např. v češtině a němčině se za levou uvozovku považuje znak „ ("dolní 99", kód dec 8222, hex 201E), za pravou pak “ ("horní 66", kód dec 8220, hex 201C). Ten samý znak s kódem 8220 ale v angličtině slouží jako levá uvozovka, zatímco jako pravá se používá znak ” ("horní 99", kód dec 8221, hex 201D).   - Typografické uvozovky se nepoužívají ve všech jazycích stejně a stojí za zvážení, zda je neřešit rovněž učením z dat. Např. v češtině a němčině se za levou uvozovku považuje znak „ ("dolní 99", kód dec 8222, hex 201E), za pravou pak “ ("horní 66", kód dec 8220, hex 201C). Ten samý znak s kódem 8220 ale v angličtině slouží jako levá uvozovka, zatímco jako pravá se používá znak ” ("horní 99", kód dec 8221, hex 201D).
   - Tečka mezi dvěma číselnými tokeny může být součást data.   - Tečka mezi dvěma číselnými tokeny může být součást data.
 +
  
  
Line 76: Line 77:
 Další informace k úkolu najdete v http://ufal.mff.cuni.cz/~zeman/vyuka/podklady/pzpj03-prvni_ukoly.pdf. Další informace k úkolu najdete v http://ufal.mff.cuni.cz/~zeman/vyuka/podklady/pzpj03-prvni_ukoly.pdf.
  
-V zimním semestru 2007-2008 jsou v nabídce němčina, švédština a ruština. Odkazy na trénovací data následují. Varování: trénovací data prošla odlišnou tokenizací, než jakou specifikuje tento dokument!+V zimním semestru 2007-2008 jsou v nabídce němčina, švédština, portugalština a ruština. Odkazy na trénovací data následují. Varování: trénovací data prošla odlišnou tokenizací, než jakou specifikuje tento dokument!
  
   * {{user:zeman:ukoly:detrain1.tok.gz|Německá data}}   * {{user:zeman:ukoly:detrain1.tok.gz|Německá data}}
   * {{user:zeman:ukoly:svtrain1.tok.gz|Švédská data}}   * {{user:zeman:ukoly:svtrain1.tok.gz|Švédská data}}
 +  * {{user:zeman:ukoly:pttrain1.tok.gz|Portugalská data}}
   * {{user:zeman:ukoly:rutrain1.tok.gz|Ruská data}}   * {{user:zeman:ukoly:rutrain1.tok.gz|Ruská data}}

[ Back to the navigation ] [ Back to the content ]