Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:treebanks [2014/05/24 17:36] zeman Arabština dočasně vyřešena. |
user:zeman:treebanks [2014/05/26 17:09] zeman Oznámení rozesláno. |
||
---|---|---|---|
Line 5: | Line 5: | ||
**Verze 2.0 by měla být hotová a zakonzervovaná nejpozději v pátek 23.5.2014!** V pondělí 26. začíná LREC na Islandu, kde bude Ruda tuto verzi prezentovat. | **Verze 2.0 by měla být hotová a zakonzervovaná nejpozději v pátek 23.5.2014!** V pondělí 26. začíná LREC na Islandu, kde bude Ruda tuto verzi prezentovat. | ||
- | * Přegenerovat Stanfordí část HamleDTa, případně ji nějak otestovat (Ruda a Honza?) | + | * <del>Přegenerovat Stanfordí část HamleDTa.</ |
- | * Vymyslet lepší hierarchii složek na disku? | + | * < |
- | * Přegenerovat HamleDT | + | * <del>Původní, pražská i stanfordská anotace</ |
- | * Původní, pražská i stanfordská anotace | + | * <del>Formáty Treex i CoNLL, pro stanfordskou anotaci navíc stanfordský formát. Každý soubor jednotlivě zagzipovat (v pracovní složce tohle zatím nemáme u stanfordských stromů)</ |
- | * Formáty Treex i CoNLL, pro stanfordskou anotaci navíc stanfordský formát | + | * < |
- | * Vyrobit patche pro non-Free treebanky, tj. CoNLL soubory s vyplněnými zadními sloupci plus jednoduchý skript, který to slepí | + | * < |
- | * Po všech testech zmrazit verzi 2.0 (archiv na disku) a vydat ji v Lindatu (buď všechny | + | * < |
+ | * < | ||
+ | * Vygenerovat HamleDT | ||
+ | * < | ||
+ | * < | ||
+ | * < | ||
+ | * < | ||
+ | * < | ||
+ | * < | ||
+ | * Asi už zrušit webový přístup k této složce. Kvůli verzi 1.0 to šlo, ale teď by měli všichni chodit přes Lindat. | ||
+ | * < | ||
* Aktualizovat [[http:// | * Aktualizovat [[http:// | ||
* < | * < | ||
- | * Podrobně popsat, "How to Get It" | + | * <del>Podrobně popsat, "How to Get It"</ |
* < | * < | ||
* < | * < | ||
* < | * < | ||
- | * Návod k použití patchů | ||
* < | * < | ||
+ | * < | ||
* < | * < | ||
* < | * < | ||
Line 26: | Line 36: | ||
* < | * < | ||
* Ve spolupráci s Honzou Ptáčkem vyrobit i grafickou upoutávku na titulní stranu | * Ve spolupráci s Honzou Ptáčkem vyrobit i grafickou upoutávku na titulní stranu | ||
- | * Nezapomenout inzerovat | + | * < |
+ | * < | ||
+ | * < | ||
* Přidat odkazy na HamleDT na všechna relevantní místa (zejména ke všem jazykům) do ACL Wiki | * Přidat odkazy na HamleDT na všechna relevantní místa (zejména ke všem jazykům) do ACL Wiki | ||
Line 35: | Line 47: | ||
* Hodila by se i podrobnější dokumentace obsahu treebanků a harmonizačního procesu. Pokud to nestihneme, tak alespoň tabulka afunů s vysvětlivky (v podstatě už ji máme v islandském článku) | * Hodila by se i podrobnější dokumentace obsahu treebanků a harmonizačního procesu. Pokud to nestihneme, tak alespoň tabulka afunů s vysvětlivky (v podstatě už ji máme v islandském článku) | ||
* Dan musí dodělat v Bibliu značkování publikací, aby bylo možné na stránky HamleDTa vygenerovat seznam všech publikací, které se HamleDTa týkají | * Dan musí dodělat v Bibliu značkování publikací, aby bylo možné na stránky HamleDTa vygenerovat seznam všech publikací, které se HamleDTa týkají | ||
+ | * Vymyslet lepší hierarchii složek na disku? | ||
+ | * Rozšířit systém testů, aby pokrýval i stanfordskou mutaci HamleDTa. | ||
+ | * Zlepšit podporu práci s CoNLL patchi. Dodat skript, který to slepí s původními daty a případně nějak pomůže u treebanků, u kterých není jasné, jak se jmenují a jak jsou uspořádané soubory, ve kterých uživatel dostal originální verzi. | ||
* Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu. | * Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu. | ||
* Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa | * Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa | ||
Line 41: | Line 56: | ||
* Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa. | * Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa. | ||
* Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel) | * Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel) | ||
+ | * Zařídit posílání e-mailů a automatické mazání výstupů, ve kterých nebyl zjištěn žádný rozdíl. Jinak se rychle zaplní disk, každou noc tam přibude několik gigabajtů. | ||
* Vytvořit webovou službu (např. scénář v rámci Treex:: | * Vytvořit webovou službu (např. scénář v rámci Treex:: | ||
* Nahradit arabská data novými (Zdeněk je slíbil do začátku května) | * Nahradit arabská data novými (Zdeněk je slíbil do začátku května) |