[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
user:zeman:ukoly:malt-parser [2007/10/26 17:17]
zeman vytvořeno
user:zeman:ukoly:malt-parser [2007/10/28 12:52]
zeman Další informace.
Line 43: Line 43:
   * Naivní parser, který se volá stejně jako výše popsané rozhraní na Malt parser, ale chová se zcela naivně (levý soused je rodič, viz výše).   * Naivní parser, který se volá stejně jako výše popsané rozhraní na Malt parser, ale chová se zcela naivně (levý soused je rodič, viz výše).
   * Skript, kterému se předá ručně rozebraný text (tzv. gold standard) a tentýž text rozebraný parserem. Skript vypíše úspěšnost parseru (tj. procento slov, jimž byl správně přiřazen rodič) a případný další rozbor chyb.   * Skript, kterému se předá ručně rozebraný text (tzv. gold standard) a tentýž text rozebraný parserem. Skript vypíše úspěšnost parseru (tj. procento slov, jimž byl správně přiřazen rodič) a případný další rozbor chyb.
 +
  
 ===== Data ===== ===== Data =====
  
-Označkovaná data ve [[Formát CoNLL|formátu CoNLL]]. Každé slovo leží na samostatném řádku, jsou tam k němu různé údaje (např. lemma, značka) oddělené tabulátory. Věty jsou oddělené prázdným řádkem.+Označkovaná data ve [[:Formát CoNLL|formátu CoNLL]]. Každé slovo leží na samostatném řádku, jsou tam k němu různé údaje (např. lemma, značka) oddělené tabulátory. Věty jsou oddělené prázdným řádkem.
  
 ==== Čeština ==== ==== Čeština ====
Line 55: Line 56:
  
 Data pocházejí ze švédského korpusu Talbanken05, který je volně dostupný na webu. Data pocházejí ze švédského korpusu Talbanken05, který je volně dostupný na webu.
-{{user:zeman:ukoly:sv.tag.zip|stáhnout}}+{{user:zeman:ukoly:sv.conll.zip|stáhnout}}
  
 ==== Dánština ==== ==== Dánština ====
  
 Data pocházejí z korpusu DDT (Danish Dependency Treebank), který je volně dostupný na webu. Data pocházejí z korpusu DDT (Danish Dependency Treebank), který je volně dostupný na webu.
-{{user:zeman:ukoly:da.tag.zip|stáhnout}}+{{user:zeman:ukoly:da.conll.zip|stáhnout}} 
 + 
 +===== Další informace ===== 
 + 
 +Tento úkol (včetně zadání konkrétního jazyka) si můžete zarezervovat vyplněním formuláře na http://ufal.mff.cuni.cz/cgi-bin/zeman/zapoctaky/rezervace_ukolu.pl (pokud ještě není rozebrán). 
 + 
 +Termín odevzdání e-mailem je konec listopadu, prezentace programu proběhne v prosinci. 

[ Back to the navigation ] [ Back to the content ]