[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:interset:to-do [2014/06/18 09:18]
zeman Předělat set() a get().
user:zeman:interset:to-do [2014/07/15 21:38]
zeman Opraveno slévání podrysů v "other" v dekódovacích tabulkách atomů.
Line 3: Line 3:
 ===== Interset 2.0 ===== ===== Interset 2.0 =====
  
-Interset is being completely rewritten using Moose, the object-oriented extension to Perl 5. In the end it will be published on CPAN as ''Lingua::Interset''+  Nějak lépe vyřešit stažené tvaryAspoň nový rysaby to nebylo v otherČeské příklonné "-s" už má rys ve dvou českých sadách (multext ajka). Taky mu nastavit 2osobusingulár aux. Podobně je na tom "proň""zač""-ť"V němčině "zum""zur"... Ve francouzštině "du""aux"... Naopak arabské "al-" sem asi nepatří, to lze prostě chápat jako morfém určitostikterý se nikdy nevyskytuje jako samostatné slovo.
- +
-  Dodělat dokumentaci POD tak, aby všechny funkce, které má uživatel k dispozici, byly zdokumentovány. +
-  * Zjistitzda by se soubor Changes nemohl jmenovat Changes.txt (jde o to, aby ho nadále našel plugin do Distzilly NextRelease). +
-  * Udělat pořádek v metodách ''set()'' ''get()'' třídy ''FeatureStructure''Metoda, která vrací podle nálady buď skalár, nebo odkaz na pole, asi vůbec nemá smyslAsi chci mít jeden getkterý vrací vždy skaláry (v případě více hodnot seřazené podle abecedy slepené svislítkem), a jiný get, který vrací vždy seznamy (v případě jedné hodnoty to bude jednoprvkový seznam). Naopak set by asi stačil jeden, který sám pozná, jestli má na vstupu jednu hodnotuněkolik hodnotsvislítka, nebo odkaz(y) na poleA pokud odkazy, tak ještě zkontrolujezda to cílové pole není náhodou jen jednoprvkové. +
-  * Opravit chybu: Jestliže mám hodnoty rysů pro ''decode()'' nachystané v tabulce a jestliže se mezi nimi vyskytne napřodkaz na pole, potom všechny struktury rysů, které ''decode()'' vrátí, budou toto pole sdílet, protože budou obsahovat stejný odkazBylo by lepší místo toho dělat hloubkové kopieaby si uživatel mohl obsah struktury bez obav měnitTohle by se dalo zařídit uvnitř metody ''multiset()''. +
-  * Přesunout ovladače konkrétních sad značek o patro níž, např. z ''Lingua::Interset::EN::Penn'' se stane ''Lingua::Interset::Tagset::EN::Penn''. Je to sice nechutně dlouhé, ale od toho nás stejně odstíní obecné funkce v hlavním modulu Intersetu. Naopak kdybychom to takhle nechali, tak máme zaděláno na problém s rozpoznáním, který modul je ovladač a který je něco jiného. A ten problém může s plnou silou udeřit pozdějiaž už budeme mít třeba 20 ovladačů a bude mnohem obtížnější to předělat. Třeba pokud se rozhodnu mít ještě nějakou další předem neohraničenou množinu modulůkteré se budou třídit podle jazyka.+
   * Projít ''###!!!'', zejména ve FeatureStructure:   * Projít ''###!!!'', zejména ve FeatureStructure:
-    * Nemohli bychom zrušit rys synpos? +    * Pokud možno zrušit synpos. Mám spočítáno, že se používá v 21 sadách, ale nevyplývá z toho, zda by se bez něj tyto sady obešly. 
-    * Co s číslovkami?+    * Číslovky více méně předělat po vzoru zájmen, pouze základní číslovky si ponechají slovní druh ''num''.
   * Přenést všechny ovladače, které vznikly v Treexu a do SVN Intersetu se zatím nedostaly.   * Přenést všechny ovladače, které vznikly v Treexu a do SVN Intersetu se zatím nedostaly.
   * Oprášit pravidelné kopírování wiki stránek Intersetu do repozitáře SVN (resp. Redmine). Nyní je tam zastaralá kopie.   * Oprášit pravidelné kopírování wiki stránek Intersetu do repozitáře SVN (resp. Redmine). Nyní je tam zastaralá kopie.

[ Back to the navigation ] [ Back to the content ]