[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:start [2011/11/30 17:14]
dusek
user:dusek:start [2012/01/24 16:41]
dusek
Line 17: Line 17:
   * [[user:dusek:formemy|Nová verze českých formémů]]   * [[user:dusek:formemy|Nová verze českých formémů]]
   * [[user:dusek:en-analyza|Anglická analýza]]   * [[user:dusek:en-analyza|Anglická analýza]]
 +
 +==== WMT 12 ====
 +
  
  
 ===== TO-DO list ===== ===== TO-DO list =====
 +  * verbal
 +    * připojování dětí - nejak vylepsit, asi nejak statisticky
 +  * falesna zlata a-rovina
 +    * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo)
 +    * oprava tagu podle t-roviny ? na a-rovine "je" jako sloveso, na t-rovine je to opravene na "#PersPron", ale gramatemy a formem to pokazi (wsj_0010)
 +    * podivne chovani zavorek -- spravit
 +    * dopsat do MonolingualGreedy, aby se uz prirazene uzly penalizovaly (opakovani stejne formy, kdy poprve je to presna forma, podruhe je tam spatna forma, ale dobre lemma -- wsj_0155##12)
 +  * Analýza
 +    * AuxY
 +    * "se" s funktorem "???"
 +  * Generování
 +    * ReverseNumberNounDependency a "málo" ("nejméně dvouprocentní růst"), "%")
 +  * funktory
 +    * bag of words jako možná featura, případně s filtrováním interpunkce apod.
 +  * formémy -- viz [[user:dusek:formemy|TODO ve formémech]]
 +  * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných)
   * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru   * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru
   * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů   * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů
-  * nové writery+  * zmenšit filtrování a zkusit funktory
   * přepsat BLEU na možnost paralelizace   * přepsat BLEU na možnost paralelizace
     * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)     * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)

[ Back to the navigation ] [ Back to the content ]