Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:ukoly:hmm-tagger [2009/02/27 17:56] zeman {{template>spolecne}} |
user:zeman:ukoly:hmm-tagger [2011/10/14 09:28] zeman Upřesnění dat. |
||
---|---|---|---|
Line 38: | Line 38: | ||
===== Data a jazyky ===== | ===== Data a jazyky ===== | ||
- | Označkovaná data v tzv. Brillově formátu. Každá věta leží na samostatném řádku. Tokeny na řádku jsou oddělené mezerou. Token je ve formátu " | + | Označkovaná data v tzv. Brillově formátu. Každá věta leží na samostatném řádku. Tokeny na řádku jsou oddělené mezerou. Token je ve formátu " |
Data obsahující navíc výstup morfologické analýzy jsou k dispozici pouze pro češtinu. Ta jsou pak uložena ve [[:formát csts|formátu CSTS]], který je založen na SGML. Ve stručnosti, | Data obsahující navíc výstup morfologické analýzy jsou k dispozici pouze pro češtinu. Ta jsou pak uložena ve [[:formát csts|formátu CSTS]], který je založen na SGML. Ve stručnosti, | ||
Line 46: | Line 46: | ||
==== Čeština ==== | ==== Čeština ==== | ||
- | Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http:// | + | Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http:// |
+ | |||
+ | Vysvětlivky k morfologickým značkám najdete např. na adrese http:// | ||
==== Švédština ==== | ==== Švédština ==== |