[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:interset:to-do [2014/06/17 16:45]
zeman Změna priorit a chyba s odkazy na pole.
user:zeman:interset:to-do [2014/07/09 18:57]
zeman cs::conll2009 zrychleno.
Line 3: Line 3:
 ===== Interset 2.0 ===== ===== Interset 2.0 =====
  
-Interset is being completely rewritten using Moose, the object-oriented extension to Perl 5. In the end it will be published on CPAN as ''Lingua::Interset''+  * Opravit práci s rysem ''other''metodě ''_encoding_step()'' třídy ''Atom''Momentálně se nemůže použít metoda ''$fs->get_other_for_tagset()'', protože atom neví, ve kterém tagsetu byl použitTaky by se pak hodnoty other neměly testovat prostým řetězcovým porovnáním, ale mělo by se zkontrolovat, že nejde o složitější strukturu, a pokud ano, tak ji porovnat hloubkově. Na hloubkové porovnání struktur už tam někde nějakou funkci mám! 
- +  * Nějak lépe vyřešit stažené tvary. Aspoň nový rys, aby to nebylo v other. České příklonné "-s" už má rys ve dvou českých sadách (multext a ajka). Taky mu nastavit 2. osobu, singulár a aux. Podobně je na tom "proň", "zač", "-ť". V němčině "zum", "zur"... Ve francouzštině "du", "aux"... Naopak arabské "al-" sem asi nepatří, to lze prostě chápat jako morfém určitosti, který se nikdy nevyskytuje jako samostatné slovo.
-  * Dodělat dokumentaci POD tak, aby všechny funkce, které má uživatel k dispozici, byly zdokumentovány. +
-  * Zjistit, zda by se soubor Changes nemohl jmenovat Changes.txt (jde o to, aby ho nadále našel plugin do Distzilly NextRelease). +
-  * Opravit chybu: Jestliže mám hodnoty rysů pro ''decode()'' nachystané v tabulce a jestliže se mezi nimi vyskytne např. odkaz na pole, potom všechny struktury rysů, které ''decode()'' vrátí, budou toto pole sdílet, protože budou obsahovat stejný odkazBylo by lepší místo toho dělat hloubkové kopie, aby si ivatel mohl obsah struktury bez obav nitTohle by se dalo zařídit uvnitř metody ''multiset()''.+
   * Projít ''###!!!'', zejména ve FeatureStructure:   * Projít ''###!!!'', zejména ve FeatureStructure:
-    * Nemohli bychom zrušit rys synpos? +    * Pokud možno zrušit synpos. Mám spočítáno, že se používá v 21 sadách, ale nevyplývá z toho, zda by se bez něj tyto sady obešly. 
-    * Co s číslovkami?+    * Číslovky více méně předělat po vzoru zájmen, pouze základní číslovky si ponechají slovní druh ''num''.
   * Přenést všechny ovladače, které vznikly v Treexu a do SVN Intersetu se zatím nedostaly.   * Přenést všechny ovladače, které vznikly v Treexu a do SVN Intersetu se zatím nedostaly.
   * Oprášit pravidelné kopírování wiki stránek Intersetu do repozitáře SVN (resp. Redmine). Nyní je tam zastaralá kopie.   * Oprášit pravidelné kopírování wiki stránek Intersetu do repozitáře SVN (resp. Redmine). Nyní je tam zastaralá kopie.

[ Back to the navigation ] [ Back to the content ]