Differences

This shows you the differences between two versions of the page.

--- user:dusek:start [2011/11/30 17:07]
dusek
+++ user:dusek:start [2012/02/12 21:57]
dusek
@@ Line 17: / Line 17: @@
   * [[user:dusek:formemy|Nová verze českých formémů]]
   * [[user:dusek:en-analyza|Anglická analýza]]
+==== WMT 12 ====
+  * [[dusek:preklad-chyby|Nalezené chyby v překladu]]
 ===== TO-DO list =====
+  * verbal
+    * připojování dětí - nejak vylepsit, asi nejak statisticky (?)
+  * falesna zlata a-rovina
+    * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo)
+    * oprava tagu podle t-roviny ? na a-rovine "je" jako sloveso, na t-rovine je to opravene na "#PersPron", ale gramatemy a formem to pokazi (wsj_0010)
+    * podivne chovani zavorek -- spravit
+    * DeleteGeneratedNodes možná maže víc, než je nutné (wsj_0155##12 -- bylo očekáváno nezůstane ani ACT, ani PAT)
+    * dopsat do evaluace něco, co bude koukat na chyby a zjišťovat jejich atributy nezávisle na atributech rodiče
+      * to pak použít s odkazem na automatické afuny, lemmata apod., abych zjistil, kde je nejvíc chyb v generování
+  * Analýza
+    * AuxY
+    * "se" s funktorem "???"
+  * Generování
+    * ReverseNumberNounDependency a "málo" ("nejméně dvouprocentní růst"), "%")
+  * funktory
+    * bag of words jako možná featura, případně s filtrováním interpunkce apod.
+  * formémy -- viz [[user:dusek:formemy#todo|TODO ve formémech]]
+  * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných)
   * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru
-  * vybufetit starý scénář analýzy (možná z treex/devel/analysis/cs, tam pak aktualizovat) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů
+  * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů
-  * jsou "jako" a "než" v překladových modelech?
+  * zmenšit filtrování a zkusit funktory
-  * nové writery
   * přepsat BLEU na možnost paralelizace
     * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)
@@ Line 31: / Line 51: @@
   * slučování formémů
   * nové formémy v překladu
-    * přeznačkovat CzEng ?
   * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock
   * sčítání modelů
@@ Line 43: / Line 62: @@
   * [[user:dusek:rants|Rants]]
   * [[user:dusek:tahaky|Taháky]]
+  * [[internal:user:dusek:napady|Nápady]]

[ Back to the navigation ] [ Back to the content ]

Institute of Formal and Applied Linguistics Wiki

Differences