[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:dusek:start [2012/02/09 14:57]
dusek
user:dusek:start [2013/04/12 14:37] (current)
dusek
Line 2: Line 2:
 [[http://tuetschek.wz.cz|Homepage]] [[http://tuetschek.wz.cz|Homepage]]
  
-===== Projekty -- popisky =====+===== Projekty ===== 
 + 
 +==== Vystadial ==== 
 +  * [[user:dusek:vystadial|Vystadial]] 
 ==== Generování češtiny (FAUST) ==== ==== Generování češtiny (FAUST) ====
   * [[user:dusek:analyza|Česká analýza]]   * [[user:dusek:analyza|Česká analýza]]
Line 19: Line 23:
  
 ==== WMT 12 ==== ==== WMT 12 ====
-  * [[dusek:preklad-chyby|Nalezené chyby v překladu]]+  * [[user:dusek:preklad-chyby|Nalezené chyby v překladu]] 
 +  * [[internal:tectomt-wmt12|TectoMT WMT 12]]
  
 +==== PhD ====
 +  * [[internal:user:dusek:phd-ideas|Nápady na PhD]]
 +  * [[internal:user:dusek:gauk|GAUK]]
 +  * [[internal:user:dusek:nlg-survey|NLG systems survey]]
  
 ===== TO-DO list ===== ===== TO-DO list =====
 +==== Generování ====
   * verbal   * verbal
-    * připojování dětí - nejak vylepsit, asi nejak statisticky+    * připojování dětí - nejak vylepsit, asi nejak statisticky (?)
   * falesna zlata a-rovina   * falesna zlata a-rovina
     * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo)     * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo)
     * oprava tagu podle t-roviny ? na a-rovine "je" jako sloveso, na t-rovine je to opravene na "#PersPron", ale gramatemy a formem to pokazi (wsj_0010)     * oprava tagu podle t-roviny ? na a-rovine "je" jako sloveso, na t-rovine je to opravene na "#PersPron", ale gramatemy a formem to pokazi (wsj_0010)
     * podivne chovani zavorek -- spravit     * podivne chovani zavorek -- spravit
-    * dopsat do MonolingualGreedy, aby se uz prirazene uzly penalizovaly (opakovani stejne formy, kdy poprve je to presna forma, podruhe je tam spatna forma, ale dobre lemma -- wsj_0155##12) 
     * DeleteGeneratedNodes možná maže víc, než je nutné (wsj_0155##12 -- bylo očekáváno nezůstane ani ACT, ani PAT)     * DeleteGeneratedNodes možná maže víc, než je nutné (wsj_0155##12 -- bylo očekáváno nezůstane ani ACT, ani PAT)
 +    * dopsat do evaluace něco, co bude koukat na chyby a zjišťovat jejich atributy nezávisle na atributech rodiče
 +      * to pak použít s odkazem na automatické afuny, lemmata apod., abych zjistil, kde je nejvíc chyb v generování
 +  * Generování
 +    * ReverseNumberNounDependency a "málo" ("nejméně dvouprocentní růst"), "%")
 +  * Wackernagel: "Nebyli se nuceni přepychu vzdát".
 +  * n:na+6 & jenž = na jehož
 +  * mozna nejake prunovani kandidatu na RelClauseCoref, nebo se zeptat Michala, jestli nema neco lepsiho (ted se neresi rod, takze vznikaji blbosti).
 +  * ma v umyslu -> v umyslu ma ... co je to za nesmysl?
 +  * nejak resit "quot"?
 +  * "jako vyzvu" - "n:jako+2" i kdyz je vyzvu nastavene spravne ... divne
 +  * "gen Ester" dává jen chemii, proč ? (obecně má "gen" problémy s uppercasovanými lemmaty)
 +
 +==== Analýza ====
   * Analýza   * Analýza
     * AuxY     * AuxY
     * "se" s funktorem "???"     * "se" s funktorem "???"
-  * Generování +  * formémy -- viz [[user:dusek:formemy#todo|TODO ve formémech]] 
-    ReverseNumberNounDependency a "málo" ("nejméně dvouprocentní růst"), "%")+  vybufetit starý scénář analýzy (z SVNa naparsovat + archivovat PDT s 1.1a. a 2. verzí formémů 
 +  * slučování formémů 
 +==== Překlad ==== 
 +  * nové formémy v překladu 
 +==== ML modely ====
   * funktory   * funktory
     * bag of words jako možná featura, případně s filtrováním interpunkce apod.     * bag of words jako možná featura, případně s filtrováním interpunkce apod.
-  * formémy -- viz [[user:dusek:formemy#todo|TODO ve formémech]] 
-  * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných) 
   * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru   * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru
-  * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů 
   * zmenšit filtrování a zkusit funktory   * zmenšit filtrování a zkusit funktory
-  * přepsat BLEU na možnost paralelizace 
-    * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu) 
   * verze bez :X formémů   * verze bez :X formémů
   * binarizované verze pokusů   * binarizované verze pokusů
 +    * proč set-aware nepomáhá ?
   * nové featury do funktorů   * nové featury do funktorů
-  * slučování formémů +  * znovu zprovoznit AverageAttributeRanks, aby bylo možné použít mrel
-  * nové formémy v překladu+
   * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock   * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock
   * sčítání modelů   * sčítání modelů
 +
 +==== Util ====
 +  * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných)
 +  * přepsat BLEU na možnost paralelizace
 +    * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)
   * AttributeStats -> Print::   * AttributeStats -> Print::
-  * znovu zprovoznit AverageAttributeRanks, aby bylo možné použít mrel 
   * LayerAttributes: přidat wild atributy a libovolný kód   * LayerAttributes: přidat wild atributy a libovolný kód
     * přes ':' nebo tak něco ? hlavně v kódu dát pozor na '->', které něco znamená (a vlastně i na mezery; chtělo by nějak obalit)     * přes ':' nebo tak něco ? hlavně v kódu dát pozor na '->', které něco znamená (a vlastně i na mezery; chtělo by nějak obalit)
     * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)     * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)
  
 +
 +===== Vyzkoušet =====
 +  * Geneva parser
 +  * JANE – RWTH Aachen
 ===== Ostatní ===== ===== Ostatní =====
   * [[user:dusek:rants|Rants]]   * [[user:dusek:rants|Rants]]
   * [[user:dusek:tahaky|Taháky]]   * [[user:dusek:tahaky|Taháky]]
   * [[internal:user:dusek:napady|Nápady]]   * [[internal:user:dusek:napady|Nápady]]
 +  * [[internal:user:dusek:whereiswhat|Where is what]] 
 +  * [[user:dusek:python|Python]] 
 +  * [[internal:user:dusek:web|Web]]
  

[ Back to the navigation ] [ Back to the content ]