[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:interset:to-do [2014/06/27 22:54]
zeman Zrychlit!
user:zeman:interset:to-do [2014/07/10 23:02]
zeman Slévání hashů pro other.
Line 3: Line 3:
 ===== Interset 2.0 ===== ===== Interset 2.0 =====
  
-  * Přejmenovat ''FeatureStructure::multiset()'' na ''add()'' (viz diskuse s Martinem). +  * Opravit práci s rysem ''other'' v metodě ''_encoding_step()'' třídy ''Atom''. Momentálně se nemůže použít metoda ''$fs->get_other_for_tagset()'', protože atom neví, ve kterém tagsetu byl použitTaky by se pak hodnoty other neměly testovat prostým řetězcovým porovnáním, ale mělo by se zkontrolovat, že nejde o složitější strukturu, a pokud ano, tak ji porovnat hloubkově. Na hloubkové porovnání struktur už tam někde nějakou funkci mám! 
-  Do FeatureStructure idat nějaký protějšek treexové metody ''match_iset()''. Mj. na ni čeká Martin+    Jestliže se u atomů osvědčí notace 'other/subfeature1', tak ji zavést i u dekódovacích tabulek, abych mohl ípadně využít i simple atomy a nemusel tam neustále dokolečka opisovat název podrysu. 
-  * Zrychlit české ovladače. Možná odstranit dvojité dědění CoNLL 2009cs::pdt má 4294 značek trvá 1:12 mincs::conll má 5150 značek trvá 1:31 mincs::conll2009 má také 5150 značekale trvá 3:30 min!+    * **A hlavně!** Zajistit, aby se při dekódování dílčí hashe pro ''other'' slévaly, ne aby se jeden odkaz na hash nahradil druhým
 +  * Nějak lépe vyřešit stažené tvary. Aspoň nový rys, aby to nebylo otherČeské příklonné "-s" už má rys ve dvou českých sadách (multext ajka)Taky mu nastavit 2. osobu, singulár auxPodobně je na tom "proň", "zač""-ť". V němčině "zum", "zur"... Ve francouzštině "du", "aux"... Naopak arabské "al-" sem asi nepatří, to lze prostě chápat jako morfém určitosti, který se nikdy nevyskytuje jako samostatné slovo.
   * Projít ''###!!!'', zejména ve FeatureStructure:   * Projít ''###!!!'', zejména ve FeatureStructure:
     * Pokud možno zrušit synpos. Mám spočítáno, že se používá v 21 sadách, ale nevyplývá z toho, zda by se bez něj tyto sady obešly.     * Pokud možno zrušit synpos. Mám spočítáno, že se používá v 21 sadách, ale nevyplývá z toho, zda by se bez něj tyto sady obešly.

[ Back to the navigation ] [ Back to the content ]