Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
user:zeman:hamledt [2014/05/30 12:52] zeman created |
user:zeman:hamledt [2014/08/04 10:05] (current) zeman Řečtina. |
||
---|---|---|---|
Line 35: | Line 35: | ||
* < | * < | ||
* < | * < | ||
+ | * < | ||
* < | * < | ||
* < | * < | ||
Line 40: | Line 41: | ||
* < | * < | ||
* < | * < | ||
+ | |||
+ | Nové po vydání HamleDTa 2.0: | ||
+ | |||
+ | * Dodělat normalizaci chorvatštiny (SETimes.HR) pro verzi 2.1. | ||
+ | * Vyměnit maďarská data za nový Szeged Treebank a přeřadit maďarštinu do námi šiřitelné části (ostatní ji nemohou šířit dál, čili to je nový druh šíření) pro verzi 2.1. | ||
+ | * Prokopis Prokopidis má zřejmě nějakou novější verzi řeckého treebanku v PML. Zkusit ji od něj získat včetně práva distribuce. Případně mu nabídnout ten reader a writer do Treexu jako protihodnotu. | ||
Odloženo na dobu po vydání HamleDTa 2.0: | Odloženo na dobu po vydání HamleDTa 2.0: | ||
Line 47: | Line 54: | ||
* < | * < | ||
* Dan musí dodělat v Bibliu značkování publikací, aby bylo možné na stránky HamleDTa vygenerovat seznam všech publikací, které se HamleDTa týkají | * Dan musí dodělat v Bibliu značkování publikací, aby bylo možné na stránky HamleDTa vygenerovat seznam všech publikací, které se HamleDTa týkají | ||
+ | * Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu. | ||
+ | * Přidat parsing stanfordské mutace. | ||
* Vymyslet lepší hierarchii složek na disku? | * Vymyslet lepší hierarchii složek na disku? | ||
+ | * Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa. | ||
+ | * Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel) | ||
+ | * Zařídit posílání e-mailů a automatické mazání výstupů, ve kterých nebyl zjištěn žádný rozdíl. Jinak se rychle zaplní disk, každou noc tam přibude několik gigabajtů. | ||
* Rozšířit systém testů, aby pokrýval i stanfordskou mutaci HamleDTa. | * Rozšířit systém testů, aby pokrýval i stanfordskou mutaci HamleDTa. | ||
* Zlepšit podporu práci s CoNLL patchi. Dodat skript, který to slepí s původními daty a případně nějak pomůže u treebanků, u kterých není jasné, jak se jmenují a jak jsou uspořádané soubory, ve kterých uživatel dostal originální verzi. | * Zlepšit podporu práci s CoNLL patchi. Dodat skript, který to slepí s původními daty a případně nějak pomůže u treebanků, u kterých není jasné, jak se jmenují a jak jsou uspořádané soubory, ve kterých uživatel dostal originální verzi. | ||
- | * Dotáhnout parsing HamleDTa 2.0 a popsat jeho výsledky na webu. | ||
* Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa | * Vymyslet způsob, jak by se obsah webu zrcadlil v SVN, kde máme treexový kód pro HamleDTa | ||
* Do jazyků s cizími písmy doplnit transliteraci. | * Do jazyků s cizími písmy doplnit transliteraci. | ||
* Pro některou z příštích verzí zvažujeme přidat automatický a zarovnaný překlad od Googlu, tak bychom transliteraci mohli odložit na stejný okamžik. | * Pro některou z příštích verzí zvažujeme přidat automatický a zarovnaný překlad od Googlu, tak bychom transliteraci mohli odložit na stejný okamžik. | ||
- | * Přidat HamleDT do (aktualizovat v) PML-TQ. Dořešit přístup pro nepřihlášené vs. přihlášené uživatele. Odkázat na to ze stránek HamleDTa. | ||
- | * Zavést verzování dat, dotáhnout pravidelné automatické regresní testování (cron-diff, Dan má zatím první nástřel) | ||
- | * Zařídit posílání e-mailů a automatické mazání výstupů, ve kterých nebyl zjištěn žádný rozdíl. Jinak se rychle zaplní disk, každou noc tam přibude několik gigabajtů. | ||
* Vytvořit webovou službu (např. scénář v rámci Treex:: | * Vytvořit webovou službu (např. scénář v rámci Treex:: | ||
* Nahradit arabská data novými (Zdeněk je slíbil do začátku května) | * Nahradit arabská data novými (Zdeněk je slíbil do začátku května) |