Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
user:zeman:ukoly:malt-parser [2007/10/26 17:17] zeman vytvořeno |
user:zeman:ukoly:malt-parser [2013/10/08 08:14] (current) zeman quest |
||
---|---|---|---|
Line 3: | Line 3: | ||
Stáhněte z internetu (např. z http:// | Stáhněte z internetu (např. z http:// | ||
- | Výsledky své práce budete prezentovat ostatním na některé prosincové přednášce. Níže najdete otázky, na které byste při experimentech měli hledat odpověď; do prezentace však zahrňte i další zajímavosti, | + | Výsledky své práce budete prezentovat ostatním na některé prosincové přednášce. Níže najdete otázky, na které byste při experimentech měli hledat odpověď; do prezentace však zahrňte i další zajímavosti, |
+ | |||
+ | Odevzdávat budete kromě prezentace také podpůrné skripty, které při experimentech potřebujete. Měly by být spíše v Perlu než v shellu a spíše platformově nezávislé - to se týká zejména těch, které přímo nevolají Nivreho software. V případě potřeby ale můžete využít externí programy běžně dostupné v Linuxu, které nelze snadno nahradit příkazy Perlu (např. gzip). Skripty by neměly záviset na konkrétním rozmístění souborů na vašem disku. Samozřejmě budou muset vědět, kde máte vybalený parser s& | ||
- | Odevzdávat budete kromě prezentace také podpůrné skripty, které při experimentech potřebujete. Měly by být spíše v Perlu než v shellu a spíše platformově nezávislé - to se týká zejména těch, které přímo nevolají Nivreho software. V případě potřeby ale můžete využít externí programy běžně dostupné v Linuxu, které nelze snadno nahradit příkazy Perlu (např. gzip). Skripty by neměly záviset na konkrétním rozmístění souborů na vašem disku. Samozřejmě budou muset vědět, kde máte vybalený tagger s příslušenstvím, | ||
===== Poznámky k architektuře ===== | ===== Poznámky k architektuře ===== | ||
Line 14: | Line 15: | ||
* Windows / Cygwin / Intel | * Windows / Cygwin / Intel | ||
* MacOS X / MacIntosh | * MacOS X / MacIntosh | ||
+ | |||
+ | **Poznámka: | ||
===== Otázky ===== | ===== Otázky ===== | ||
Line 43: | Line 46: | ||
* Naivní parser, který se volá stejně jako výše popsané rozhraní na Malt parser, ale chová se zcela naivně (levý soused je rodič, viz výše). | * Naivní parser, který se volá stejně jako výše popsané rozhraní na Malt parser, ale chová se zcela naivně (levý soused je rodič, viz výše). | ||
* Skript, kterému se předá ručně rozebraný text (tzv. gold standard) a tentýž text rozebraný parserem. Skript vypíše úspěšnost parseru (tj. procento slov, jimž byl správně přiřazen rodič) a případný další rozbor chyb. | * Skript, kterému se předá ručně rozebraný text (tzv. gold standard) a tentýž text rozebraný parserem. Skript vypíše úspěšnost parseru (tj. procento slov, jimž byl správně přiřazen rodič) a případný další rozbor chyb. | ||
+ | |||
===== Data ===== | ===== Data ===== | ||
- | Označkovaná data ve [[Formát CoNLL|formátu CoNLL]]. Každé slovo leží na samostatném řádku, jsou tam k němu různé údaje (např. lemma, značka) oddělené tabulátory. Věty jsou oddělené prázdným řádkem. | + | Označkovaná data ve [[:Formát CoNLL|formátu CoNLL]]. Každé slovo leží na samostatném řádku, jsou tam k němu různé údaje (např. lemma, značka) oddělené tabulátory. Věty jsou oddělené prázdným řádkem. |
==== Čeština ==== | ==== Čeština ==== | ||
- | Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http:// | + | Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http:// |
==== Švédština ==== | ==== Švédština ==== | ||
Data pocházejí ze švédského korpusu Talbanken05, | Data pocházejí ze švédského korpusu Talbanken05, | ||
- | {{user: | + | {{user: |
==== Dánština ==== | ==== Dánština ==== | ||
Data pocházejí z korpusu DDT (Danish Dependency Treebank), který je volně dostupný na webu. | Data pocházejí z korpusu DDT (Danish Dependency Treebank), který je volně dostupný na webu. | ||
- | {{user: | + | {{user: |
+ | |||
+ | ===== Další informace ===== | ||
+ | |||
+ | Tento úkol (včetně zadání konkrétního jazyka) si můžete zarezervovat vyplněním formuláře na http:// | ||
+ | |||
+ | Termín odevzdání e-mailem je konec listopadu, prezentace programu proběhne v prosinci. |