Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:treebanks [2014/05/24 22:33] zeman |
user:zeman:treebanks [2014/05/25 09:44] zeman Aktualizován seznam úkolů. |
||
---|---|---|---|
Line 6: | Line 6: | ||
* < | * < | ||
- | * Přegenerovat HamleDT | + | * < |
- | * Původní, pražská i stanfordská anotace | + | * <del>Původní, pražská i stanfordská anotace</ |
- | * Formáty Treex i CoNLL, pro stanfordskou anotaci navíc stanfordský formát | + | * <del>Formáty Treex i CoNLL, pro stanfordskou anotaci navíc stanfordský formát. Každý soubor jednotlivě zagzipovat (v pracovní složce tohle zatím nemáme u stanfordských stromů)</ |
- | * Vyrobit patche pro non-Free treebanky, tj. CoNLL soubory s vyplněnými zadními sloupci plus jednoduchý skript, který to slepí | + | * < |
- | * Po všech testech zmrazit verzi 2.0 (archiv na disku) a vydat ji v Lindatu (buď všechny | + | * Otestovat alespoň, že máme pro každý jazyk stejnou sadu souborů za každý typ/formát. |
+ | * V archivní složce rekurzivně odebrat právo zápisu. | ||
+ | * Připravit aktuální soubor | ||
+ | * Vygenerovat HamleDT | ||
+ | * < | ||
+ | * < | ||
+ | * Opět otestovat alespoň počty a názvy souborů | ||
+ | * Místo souboru s testy vložit '' | ||
+ | * Celé to zabalit do jednoho balíku '' | ||
+ | * Asi už zrušit webový přístup k této složce. Kvůli verzi 1.0 to šlo, ale teď by měli všichni chodit přes Lindat. | ||
+ | * Vydat HamleDT 2.0 free v Lindatu. | ||
* Aktualizovat [[http:// | * Aktualizovat [[http:// | ||
* < | * < | ||
Line 37: | Line 47: | ||
* Vymyslet lepší hierarchii složek na disku? | * Vymyslet lepší hierarchii složek na disku? | ||
* Rozšířit systém testů, aby pokrýval i stanfordskou mutaci HamleDTa. | * Rozšířit systém testů, aby pokrýval i stanfordskou mutaci HamleDTa. | ||
+ | * Zlepšit podporu práci s CoNLL patchi. Dodat skript, který to slepí s původními daty a případně nějak pomůže u treebanků, u kterých není jasné, jak se jmenují a jak jsou uspořádané soubory, ve kterých uživatel dostal originální verzi. | ||
* Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu. | * Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu. | ||
* Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa | * Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa |