[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:ukoly:hranice-slov-a-vet [2007/10/17 13:24]
zeman Typografické uvozovky.
user:zeman:ukoly:hranice-slov-a-vet [2007/10/17 18:44]
zeman Drobná úprava.
Line 62: Line 62:
   - Typografické uvozovky se nepoužívají ve všech jazycích stejně a stojí za zvážení, zda je neřešit rovněž učením z dat. Např. v češtině a němčině se za levou uvozovku považuje znak „ ("dolní 99", kód dec 8222, hex 201E), za pravou pak “ ("horní 66", kód dec 8220, hex 201C). Ten samý znak s kódem 8220 ale v angličtině slouží jako levá uvozovka, zatímco jako pravá se používá znak ” ("horní 99", kód dec 8221, hex 201D).   - Typografické uvozovky se nepoužívají ve všech jazycích stejně a stojí za zvážení, zda je neřešit rovněž učením z dat. Např. v češtině a němčině se za levou uvozovku považuje znak „ ("dolní 99", kód dec 8222, hex 201E), za pravou pak “ ("horní 66", kód dec 8220, hex 201C). Ten samý znak s kódem 8220 ale v angličtině slouží jako levá uvozovka, zatímco jako pravá se používá znak ” ("horní 99", kód dec 8221, hex 201D).
   - Tečka mezi dvěma číselnými tokeny může být součást data.   - Tečka mezi dvěma číselnými tokeny může být součást data.
 +
 +
 +
 +
  
  
Line 72: Line 76:
 Další informace k úkolu najdete v http://ufal.mff.cuni.cz/~zeman/vyuka/podklady/pzpj03-prvni_ukoly.pdf. Další informace k úkolu najdete v http://ufal.mff.cuni.cz/~zeman/vyuka/podklady/pzpj03-prvni_ukoly.pdf.
  
-V zimním semestru 2007-2008 jsou v nabídce němčina, švédština a ruština. Odkaz na trénovací data se zde objeví do konce října 2007.+V zimním semestru 2007-2008 jsou v nabídce němčina, švédština a ruština. Odkazy na trénovací data následujíVarování: trénovací data prošla odlišnou tokenizací, než jakou specifikuje tento dokument! 
 + 
 +  * {{user:zeman:ukoly:detrain1.tok.gz|Německá data}} 
 +  * {{user:zeman:ukoly:svtrain1.tok.gz|Švédská data}} 
 +  * {{user:zeman:ukoly:rutrain1.tok.gz|Ruská data}}

[ Back to the navigation ] [ Back to the content ]