[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:start [2011/10/27 14:57]
dusek
user:dusek:start [2012/02/12 21:57]
dusek
Line 1: Line 1:
-==== Ondřej Dušek ====+====== Ondřej Dušek ======
 [[http://tuetschek.wz.cz|Homepage]] [[http://tuetschek.wz.cz|Homepage]]
  
-=== Projekty -- popisky === +===== Projekty -- popisky ===== 
-== Generování češtiny (FAUST) ==+==== Generování češtiny (FAUST) ====
   * [[user:dusek:analyza|Česká analýza]]   * [[user:dusek:analyza|Česká analýza]]
   * [[user:dusek:formemy_gen|Automatická detekce formémů z funktorů]]   * [[user:dusek:formemy_gen|Automatická detekce formémů z funktorů]]
Line 13: Line 13:
   * [[user:dusek:gen-vysl|Výsledky]]   * [[user:dusek:gen-vysl|Výsledky]]
  
-== CzEng ==+==== CzEng 1.0 ====
   * [[user:dusek:funktory|Automatická detekce funktorů]]   * [[user:dusek:funktory|Automatická detekce funktorů]]
   * [[user:dusek:formemy|Nová verze českých formémů]]   * [[user:dusek:formemy|Nová verze českých formémů]]
 +  * [[user:dusek:en-analyza|Anglická analýza]]
  
-=== TO-DO list ===+==== WMT 12 ==== 
 +  * [[dusek:preklad-chyby|Nalezené chyby v překladu]]
  
-  * OPRAVIT DEFAULT STRING + 
-  * ANGLICKÉ FORMÉMY +===== TO-DO list ===== 
-  * nový model: počkat chvíli pak zkopírovat modely na správné umístění +  * verbal 
-    * opravit modely (vyhodit nebinarizované+    * připojování dětí - nejak vylepsit, asi nejak statisticky (?) 
-  vybufetit starý scénář analýzy (možná z treex/devel/analysis/cstam pak aktualizovat) a naparsovat + archivovat PDT 1.1aa 2. verzí formémů +  * falesna zlata a-rovina 
-  * dohodnout se s Pepou na formémech v PCEDT +    * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo
-  * model pro koordinační hlavy +    oprava tagu podle t-roviny ? na a-rovine "je" jako sloveso, na t-rovine je to opravene na "#PersPron", ale gramatemy a formem to pokazi (wsj_0010) 
-  * model pro angličtinu +    * podivne chovani zavorek -- spravit 
-  * test na overtraining (hodnocení trén. dat+    * DeleteGeneratedNodes možná maže vícnež je nutné (wsj_0155##12 -- bylo očekáváno nezůstane ani ACT, ani PAT) 
-  * jsou "jako" a "než" v překladových modelech? +    * dopsat do evaluace něco, co bude koukat na chyby zjišťovat jejich atributy nezávisle na atributech rodiče 
-  * nové writery+      * to pak použít odkazem na automatické afunylemmata apod., abych zjistil, kde je nejvíc chyb v generování 
 +  * Analýza 
 +    * AuxY 
 +    * "sefunktorem "???" 
 +  * Generování 
 +    * ReverseNumberNounDependency a "málo" ("nejméně dvouprocentní růst"), "%") 
 +  * funktory 
 +    * bag of words jako možná featura, případně s filtrováním interpunkce apod. 
 +  * formémy -- viz [[user:dusek:formemy#todo|TODO ve formémech]] 
 +  * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných
 +  * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru 
 +  * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů 
 +  * zmenšit filtrování a zkusit funktory
   * přepsat BLEU na možnost paralelizace   * přepsat BLEU na možnost paralelizace
     * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)     * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)
Line 37: Line 51:
   * slučování formémů   * slučování formémů
   * nové formémy v překladu   * nové formémy v překladu
-    * přeznačkovat CzEng ? 
   * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock   * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock
   * sčítání modelů   * sčítání modelů
Line 46: Line 59:
     * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)     * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)
  
 +===== Ostatní =====
 +  * [[user:dusek:rants|Rants]]
 +  * [[user:dusek:tahaky|Taháky]]
 +  * [[internal:user:dusek:napady|Nápady]]
  
-=== Rants === 
-== PDT == 
-  * //aby, kdyby// -- proč je tense=ant, verbmod=ind (proti //by//, kde je tense=sim, verbmod=cdn) 
-  * proč se nerozlišuje epistemická modalita? 
-  * proč není v popisu PDT u morfologie uvedený P1 a A2 ? 
- 
-== Morfoanalýza == 
-  * proč se neurčuje A2 u česko - slovenský apod. ? 
-  * Havlíčkův-2, Romeův, Richterův, Poův / Poeův, Káňův, Hubbleův (a možná další) 
  

[ Back to the navigation ] [ Back to the content ]