[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:zeman:interset:to-do [2014/07/09 12:13]
zeman cs::ajka
user:zeman:interset:to-do [2014/07/25 13:58] (current)
zeman Autoři u cs::ajka.
Line 3: Line 3:
 ===== Interset 2.0 ===== ===== Interset 2.0 =====
  
-  * cs::ajkaodstranit příklady ze seznamu povolených značek. Uklidit pomocné neverzované soubory, které vznikly, když jsem zkoumal Majku+  * Opravit češtinu (UTF8) v komentáři ABSTRACT pro Pod::Weaver. Jinde je kódování v pořádku, ale tuhle větu Pod::Weaver rozebírá a čte ji špatně
-  Opravit práci s rysem ''other'' metodě ''_encoding_step()'' třídy ''Atom''Momentálně se nemůže použít metoda ''$fs->get_other_for_tagset()''protože atom nevíve kterém tagsetu byl použitTaky by se pak hodnoty other neměly testovat prostým řetězcovým porovnánímale mělo by se zkontrolovat, že nejde o složitější strukturu, a pokud ano, tak ji porovnat hloubkověNa hloubkové porovnání struktur už tam někde nějakou funkci mám!+    A další c v POD: U CS::Ajka mám dvě sekce AUTHORJednu vloženou ručně, kde je navíc Petr Pořízka a Markus Schäfer, a druhou vloženou automatickykde jsem jenom jáChtělo by to zaříditaby v tomto konkrétním případě se ta automatická vynechala.
   * Nějak lépe vyřešit stažené tvary. Aspoň nový rys, aby to nebylo v other. České příklonné "-s" už má rys ve dvou českých sadách (multext a ajka). Taky mu nastavit 2. osobu, singulár a aux. Podobně je na tom "proň", "zač", "-ť". V němčině "zum", "zur"... Ve francouzštině "du", "aux"... Naopak arabské "al-" sem asi nepatří, to lze prostě chápat jako morfém určitosti, který se nikdy nevyskytuje jako samostatné slovo.   * Nějak lépe vyřešit stažené tvary. Aspoň nový rys, aby to nebylo v other. České příklonné "-s" už má rys ve dvou českých sadách (multext a ajka). Taky mu nastavit 2. osobu, singulár a aux. Podobně je na tom "proň", "zač", "-ť". V němčině "zum", "zur"... Ve francouzštině "du", "aux"... Naopak arabské "al-" sem asi nepatří, to lze prostě chápat jako morfém určitosti, který se nikdy nevyskytuje jako samostatné slovo.
-  * Zrychlit české ovladače. Možná odstranit dvojité dědění v CoNLL 2009. cs::pdt má 4294 značek a trvá 1:12 min. cs::conll má 5150 značek a trvá 1:31 min. cs::conll2009 má také 5150 značek, ale trvá 3:30 min! 
   * Projít ''###!!!'', zejména ve FeatureStructure:   * Projít ''###!!!'', zejména ve FeatureStructure:
     * Pokud možno zrušit synpos. Mám spočítáno, že se používá v 21 sadách, ale nevyplývá z toho, zda by se bez něj tyto sady obešly.     * Pokud možno zrušit synpos. Mám spočítáno, že se používá v 21 sadách, ale nevyplývá z toho, zda by se bez něj tyto sady obešly.

[ Back to the navigation ] [ Back to the content ]