[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:ukoly:brilluv-tagger [2007/10/24 21:53]
zeman Čárka.
user:zeman:ukoly:brilluv-tagger [2007/10/24 22:04]
zeman Data.
Line 34: Line 34:
   * Skript, kterému se předá ručně označkovaný text (tzv. gold standard) a tentýž text označkovaný taggerem. Skript vypíše úspěšnost značkování taggeru (tj. procento správně označkovaných slov) a případný další rozbor chyb.   * Skript, kterému se předá ručně označkovaný text (tzv. gold standard) a tentýž text označkovaný taggerem. Skript vypíše úspěšnost značkování taggeru (tj. procento správně označkovaných slov) a případný další rozbor chyb.
  
 +===== Data =====
 +
 +==== Čeština ====
 +
 +Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http://ufal.mff.cuni.cz/corp-lic/pdt20-reg.html; do kolonky //Optional information// vyplňte "PFL007". O registraci bych se měl dozvědět a poslat vám odkaz na data.
 +
 +==== Švédština ====
 +
 +Data pocházejí ze švédského korpusu Talbanken05, který je volně dostupný na webu.
 +
 +==== Dánština ====
 +
 +Data pocházejí z korpusu DDT (Danish Dependency Treebank), který je volně dostupný na webu.

[ Back to the navigation ] [ Back to the content ]