[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
user:zeman:hamledt [2014/05/30 12:52]
zeman created
user:zeman:hamledt [2014/08/04 10:05] (current)
zeman Řečtina.
Line 35: Line 35:
       * <del>Numerous bugfixes</del>       * <del>Numerous bugfixes</del>
     * <del>Ve spolupráci s Honzou Ptáčkem vyrobit i grafickou upoutávku na titulní stranu</del>     * <del>Ve spolupráci s Honzou Ptáčkem vyrobit i grafickou upoutávku na titulní stranu</del>
 +    * <del>Zkontrolovat a aktualizovat upoutávku na http://ufal.mff.cuni.cz/projects/corpora</del>
   * <del>Inzerovat HamleDT 2.0 v corpora@uib.no!</del>   * <del>Inzerovat HamleDT 2.0 v corpora@uib.no!</del>
   * <del>Inzerovat na ufal-l (tam včetně místní cesty k neveřejným datům)</del>   * <del>Inzerovat na ufal-l (tam včetně místní cesty k neveřejným datům)</del>
Line 40: Line 41:
   * <del>Inzerovat na facebookové stránce ÚFALu</del>   * <del>Inzerovat na facebookové stránce ÚFALu</del>
   * <del>Přidat odkazy na HamleDT na všechna relevantní místa (zejména ke všem jazykům) do ACL Wiki</del>   * <del>Přidat odkazy na HamleDT na všechna relevantní místa (zejména ke všem jazykům) do ACL Wiki</del>
 +
 +Nové po vydání HamleDTa 2.0:
 +
 +  * Dodělat normalizaci chorvatštiny (SETimes.HR) pro verzi 2.1.
 +  * Vyměnit maďarská data za nový Szeged Treebank a přeřadit maďarštinu do námi šiřitelné části (ostatní ji nemohou šířit dál, čili to je nový druh šíření) pro verzi 2.1.
 +  * Prokopis Prokopidis má zřejmě nějakou novější verzi řeckého treebanku v PML. Zkusit ji od něj získat včetně práva distribuce. Případně mu nabídnout ten reader a writer do Treexu jako protihodnotu.
  
 Odloženo na dobu po vydání HamleDTa 2.0: Odloženo na dobu po vydání HamleDTa 2.0:
Line 47: Line 54:
     * <del>Hodila by se i podrobnější dokumentace obsahu treebanků a harmonizačního procesu. Pokud to nestihneme, tak alespoň tabulka afunů s vysvětlivky (v podstatě už ji máme v islandském článku)</del>     * <del>Hodila by se i podrobnější dokumentace obsahu treebanků a harmonizačního procesu. Pokud to nestihneme, tak alespoň tabulka afunů s vysvětlivky (v podstatě už ji máme v islandském článku)</del>
     * Dan musí dodělat v Bibliu značkování publikací, aby bylo možné na stránky HamleDTa vygenerovat seznam všech publikací, které se HamleDTa týkají     * Dan musí dodělat v Bibliu značkování publikací, aby bylo možné na stránky HamleDTa vygenerovat seznam všech publikací, které se HamleDTa týkají
 +  * Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu.
 +    * Přidat parsing stanfordské mutace.
   * Vymyslet lepší hierarchii složek na disku?   * Vymyslet lepší hierarchii složek na disku?
 +  * Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa.
 +  * Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel)
 +    * Zařídit posílání e-mailů a automatické mazání výstupů, ve kterých nebyl zjištěn žádný rozdíl. Jinak se rychle zaplní disk, každou noc tam přibude několik gigabajtů.
   * Rozšířit systém testů, aby pokrýval i stanfordskou mutaci HamleDTa.   * Rozšířit systém testů, aby pokrýval i stanfordskou mutaci HamleDTa.
   * Zlepšit podporu práci s CoNLL patchi. Dodat skript, který to slepí s původními daty a případně nějak pomůže u treebanků, u kterých není jasné, jak se jmenují a jak jsou uspořádané soubory, ve kterých uživatel dostal originální verzi.   * Zlepšit podporu práci s CoNLL patchi. Dodat skript, který to slepí s původními daty a případně nějak pomůže u treebanků, u kterých není jasné, jak se jmenují a jak jsou uspořádané soubory, ve kterých uživatel dostal originální verzi.
-  * Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu. 
   * Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa   * Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa
   * Do jazyků s cizími písmy doplnit transliteraci.   * Do jazyků s cizími písmy doplnit transliteraci.
     * Pro některou z příštích verzí zvažujeme přidat automatický a zarovnaný překlad od Googlu, tak bychom transliteraci mohli odložit na stejný okamžik.     * Pro některou z příštích verzí zvažujeme přidat automatický a zarovnaný překlad od Googlu, tak bychom transliteraci mohli odložit na stejný okamžik.
-  * Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa. 
-  * Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel) 
-    * Zařídit posílání e-mailů a automatické mazání výstupů, ve kterých nebyl zjištěn žádný rozdíl. Jinak se rychle zaplní disk, každou noc tam přibude několik gigabajtů. 
   * Vytvořit webovou službu (např. scénář v rámci Treex::Web), s jejíž pomocí si uživatel bude moci normalizovat nebo transformovat svoje data, aniž by si musel nainstalovat Treex u sebe. Podmínit to nějakým souhlasem, že smíme zpracovat jeho data.   * Vytvořit webovou službu (např. scénář v rámci Treex::Web), s jejíž pomocí si uživatel bude moci normalizovat nebo transformovat svoje data, aniž by si musel nainstalovat Treex u sebe. Podmínit to nějakým souhlasem, že smíme zpracovat jeho data.
   * Nahradit arabská data novými (Zdeněk je slíbil do začátku května)   * Nahradit arabská data novými (Zdeněk je slíbil do začátku května)

[ Back to the navigation ] [ Back to the content ]