[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:treebanks [2014/05/25 09:47]
zeman
user:zeman:treebanks [2014/05/26 21:04]
zeman
Line 10: Line 10:
     * <del>Formáty Treex i CoNLL, pro stanfordskou anotaci navíc stanfordský formát. Každý soubor jednotlivě zagzipovat (v pracovní složce tohle zatím nemáme u stanfordských stromů)</del>     * <del>Formáty Treex i CoNLL, pro stanfordskou anotaci navíc stanfordský formát. Každý soubor jednotlivě zagzipovat (v pracovní složce tohle zatím nemáme u stanfordských stromů)</del>
     * <del>Aktuální výsledky testů pražské anotace (''make table > tests.txt'')</del>     * <del>Aktuální výsledky testů pražské anotace (''make table > tests.txt'')</del>
-    * Otestovat alespoň, že máme pro každý jazyk stejnou sadu souborů za každý typ/formát. +    * <del>Otestovat alespoň, že máme pro každý jazyk stejnou sadu souborů za každý typ/formát.</del> 
-    * V archivní složce rekurzivně odebrat právo zápisu. +    * <del>V archivní složce rekurzivně odebrat právo zápisu.</del> 
-  * Připravit aktuální soubor s licencí, odkazy na původní treebanky jakož i na web HamleDTa: ''README.txt''+  * <del>Připravit aktuální soubor s licencí, odkazy na původní treebanky jakož i na web HamleDTa: ''README.txt''.</del> 
-  * Vygenerovat HamleDT 2.0 free do ''/net/projects/tectomt_shared/hamledt/2.0'':+  * <del>Vygenerovat HamleDT 2.0 free do ''/net/projects/tectomt_shared/hamledt/2.0'':</del>
     * <del>Pro 13 volných jazyků (ar, cs, da, et, fa, fi, grc, la, nl, pt, ro, sv, ta) zkopírovat všechny soubory, které jsme dali do archivu.</del>     * <del>Pro 13 volných jazyků (ar, cs, da, et, fa, fi, grc, la, nl, pt, ro, sv, ta) zkopírovat všechny soubory, které jsme dali do archivu.</del>
     * <del>Pro zbývající jazyky pouze CoNLL patche (pražská i stanfordská anotace).</del>     * <del>Pro zbývající jazyky pouze CoNLL patche (pražská i stanfordská anotace).</del>
-    * Opět otestovat alespoň počty a názvy souborů pro jednotlivé jazyky a datové formáty. +    * <del>Opět otestovat alespoň počty a názvy souborů pro jednotlivé jazyky a datové formáty.</del> 
-    * Místo souboru s testy vložit ''README.txt'' s licencí a odkazy (viz výše). +    * <del>Místo souboru s testy vložit ''README.txt'' s licencí a odkazy (viz výše).</del> 
-    * Celé to zabalit do jednoho balíku ''.tar''. +    * <del>Rekurzivně odebrat právo zápisu.</del> 
-    * Asi už zrušit webový přístup k této složce. Kvůli verzi 1.0 to šlo, ale teď by měli všichni chodit přes Lindat. +    * <del>Celé to zabalit do jednoho balíku ''hamledt-2.0-free.tar''.</del> 
-  * Vydat HamleDT 2.0 free v Lindatu. +  * <del>Vydat HamleDT 2.0 free v Lindatu.</del> 
-  * Aktualizovat [[http://ufal.mff.cuni.cz/hamledt|web HamleDT]]+  * <del>Aktualizovat [[http://ufal.mff.cuni.cz/hamledt|web HamleDT]]</del>
     * <del>Podrobně popsat, jaké korpusy a jazyky současná verze obsahuje</del>     * <del>Podrobně popsat, jaké korpusy a jazyky současná verze obsahuje</del>
     * <del>Podrobně popsat, "How to Get It"</del>     * <del>Podrobně popsat, "How to Get It"</del>
Line 34: Line 34:
       * <del>Stanfordské transformace</del>       * <del>Stanfordské transformace</del>
       * <del>Numerous bugfixes</del>       * <del>Numerous bugfixes</del>
-    * Ve spolupráci s Honzou Ptáčkem vyrobit i grafickou upoutávku na titulní stranu +    * <del>Ve spolupráci s Honzou Ptáčkem vyrobit i grafickou upoutávku na titulní stranu</del> 
-    * Inzerovat na facebookové stránce ÚFALu +  * <del>Inzerovat HamleDT 2.0 v corpora@uib.no!</del> 
-  * Nezapomenout inzerovat HamleDT 2.0 v corpora@uib.no! +  * <del>Inzerovat na ufal-l (tam včetně místní cesty k neveřejným datům)</del> 
-  * Přidat odkazy na HamleDT na všechna relevantní místa (zejména ke všem jazykům) do ACL Wiki+  * <del>Upozornit stávající uživatele HamleDTa na novou verzi</del> 
 +  * <del>Inzerovat na facebookové stránce ÚFALu</del> 
 +  * <del>Přidat odkazy na HamleDT na všechna relevantní místa (zejména ke všem jazykům) do ACL Wiki</del>
  
 Odloženo na dobu po vydání HamleDTa 2.0: Odloženo na dobu po vydání HamleDTa 2.0:
Line 54: Line 56:
   * Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa.   * Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa.
   * Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel)   * Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel)
 +    * Zařídit posílání e-mailů a automatické mazání výstupů, ve kterých nebyl zjištěn žádný rozdíl. Jinak se rychle zaplní disk, každou noc tam přibude několik gigabajtů.
   * Vytvořit webovou službu (např. scénář v rámci Treex::Web), s jejíž pomocí si uživatel bude moci normalizovat nebo transformovat svoje data, aniž by si musel nainstalovat Treex u sebe. Podmínit to nějakým souhlasem, že smíme zpracovat jeho data.   * Vytvořit webovou službu (např. scénář v rámci Treex::Web), s jejíž pomocí si uživatel bude moci normalizovat nebo transformovat svoje data, aniž by si musel nainstalovat Treex u sebe. Podmínit to nějakým souhlasem, že smíme zpracovat jeho data.
   * Nahradit arabská data novými (Zdeněk je slíbil do začátku května)   * Nahradit arabská data novými (Zdeněk je slíbil do začátku května)

[ Back to the navigation ] [ Back to the content ]