Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:ukoly:hmm-tagger [2009/11/29 11:47] zeman NPFL007. |
user:zeman:ukoly:hmm-tagger [2011/10/14 09:28] zeman Upřesnění dat. |
||
---|---|---|---|
Line 38: | Line 38: | ||
===== Data a jazyky ===== | ===== Data a jazyky ===== | ||
- | Označkovaná data v tzv. Brillově formátu. Každá věta leží na samostatném řádku. Tokeny na řádku jsou oddělené mezerou. Token je ve formátu " | + | Označkovaná data v tzv. Brillově formátu. Každá věta leží na samostatném řádku. Tokeny na řádku jsou oddělené mezerou. Token je ve formátu " |
Data obsahující navíc výstup morfologické analýzy jsou k dispozici pouze pro češtinu. Ta jsou pak uložena ve [[:formát csts|formátu CSTS]], který je založen na SGML. Ve stručnosti, | Data obsahující navíc výstup morfologické analýzy jsou k dispozici pouze pro češtinu. Ta jsou pak uložena ve [[:formát csts|formátu CSTS]], který je založen na SGML. Ve stručnosti, | ||
<code xml>< | <code xml>< | ||
- | |||
==== Čeština ==== | ==== Čeština ==== | ||
- | Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http:// | + | Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http:// |
+ | |||
+ | Vysvětlivky k morfologickým značkám najdete např. na adrese http:// | ||
==== Švédština ==== | ==== Švédština ==== |