[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:ukoly:hranice-slov-a-vet [2007/10/17 18:21]
zeman Švédská data.
user:zeman:ukoly:hranice-slov-a-vet [2007/10/27 19:02]
zeman Portugalská data.
Line 62: Line 62:
   - Typografické uvozovky se nepoužívají ve všech jazycích stejně a stojí za zvážení, zda je neřešit rovněž učením z dat. Např. v češtině a němčině se za levou uvozovku považuje znak „ ("dolní 99", kód dec 8222, hex 201E), za pravou pak “ ("horní 66", kód dec 8220, hex 201C). Ten samý znak s kódem 8220 ale v angličtině slouží jako levá uvozovka, zatímco jako pravá se používá znak ” ("horní 99", kód dec 8221, hex 201D).   - Typografické uvozovky se nepoužívají ve všech jazycích stejně a stojí za zvážení, zda je neřešit rovněž učením z dat. Např. v češtině a němčině se za levou uvozovku považuje znak „ ("dolní 99", kód dec 8222, hex 201E), za pravou pak “ ("horní 66", kód dec 8220, hex 201C). Ten samý znak s kódem 8220 ale v angličtině slouží jako levá uvozovka, zatímco jako pravá se používá znak ” ("horní 99", kód dec 8221, hex 201D).
   - Tečka mezi dvěma číselnými tokeny může být součást data.   - Tečka mezi dvěma číselnými tokeny může být součást data.
 +
 +
 +
  
  
Line 74: Line 77:
 Další informace k úkolu najdete v http://ufal.mff.cuni.cz/~zeman/vyuka/podklady/pzpj03-prvni_ukoly.pdf. Další informace k úkolu najdete v http://ufal.mff.cuni.cz/~zeman/vyuka/podklady/pzpj03-prvni_ukoly.pdf.
  
-V zimním semestru 2007-2008 jsou v nabídce němčina, švédština a ruština. Odkaz na trénovací data se zde objeví do konce října 2007. Varování: trénovací data prošla odlišnou tokenizací, než jakou specifikuje tento dokument!+V zimním semestru 2007-2008 jsou v nabídce němčina, švédština, portugalština a ruština. Odkazy na trénovací data následují. Varování: trénovací data prošla odlišnou tokenizací, než jakou specifikuje tento dokument!
  
   * {{user:zeman:ukoly:detrain1.tok.gz|Německá data}}   * {{user:zeman:ukoly:detrain1.tok.gz|Německá data}}
   * {{user:zeman:ukoly:svtrain1.tok.gz|Švédská data}}   * {{user:zeman:ukoly:svtrain1.tok.gz|Švédská data}}
 +  * {{user:zeman:ukoly:pttrain1.tok.gz|Portugalská data}}
 +  * {{user:zeman:ukoly:rutrain1.tok.gz|Ruská data}}

[ Back to the navigation ] [ Back to the content ]