[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:start [2012/01/24 16:41]
dusek
user:dusek:start [2012/10/29 11:17]
dusek
Line 2: Line 2:
 [[http://tuetschek.wz.cz|Homepage]] [[http://tuetschek.wz.cz|Homepage]]
  
-===== Projekty -- popisky =====+===== Projekty ===== 
 + 
 +==== Vystadial ==== 
 +  * [[user:dusek:vystadial|Vystadial]] 
 ==== Generování češtiny (FAUST) ==== ==== Generování češtiny (FAUST) ====
   * [[user:dusek:analyza|Česká analýza]]   * [[user:dusek:analyza|Česká analýza]]
Line 19: Line 23:
  
 ==== WMT 12 ==== ==== WMT 12 ====
 +  * [[user:dusek:preklad-chyby|Nalezené chyby v překladu]]
 +  * [[internal:tectomt-wmt12|TectoMT WMT 12]]
  
 +==== PhD ideas ==== 
 +  * [[internal:user:dusek:phd-ideas|Nápady na PhD]] 
 +  * [[internal:user:dusek:gauk|GAUK]]
  
 ===== TO-DO list ===== ===== TO-DO list =====
 +==== Generování ====
   * verbal   * verbal
-    * připojování dětí - nejak vylepsit, asi nejak statisticky+    * připojování dětí - nejak vylepsit, asi nejak statisticky (?)
   * falesna zlata a-rovina   * falesna zlata a-rovina
     * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo)     * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo)
     * oprava tagu podle t-roviny ? na a-rovine "je" jako sloveso, na t-rovine je to opravene na "#PersPron", ale gramatemy a formem to pokazi (wsj_0010)     * oprava tagu podle t-roviny ? na a-rovine "je" jako sloveso, na t-rovine je to opravene na "#PersPron", ale gramatemy a formem to pokazi (wsj_0010)
     * podivne chovani zavorek -- spravit     * podivne chovani zavorek -- spravit
-    * dopsat do MonolingualGreedyaby se uz prirazene uzly penalizovaly (opakovani stejne formykdy poprve je to presna forma, podruhe je tam spatna formaale dobre lemma -- wsj_0155##12)+    * DeleteGeneratedNodes možná maže víc, než je nutné (wsj_0155##12 -- bylo očekáváno nezůstane ani ACT, ani PAT) 
 +    * dopsat do evaluace něcoco bude koukat na chyby a zjišťovat jejich atributy nezávisle na atributech rodiče 
 +      * to pak použít s odkazem na automatické afuny, lemmata apod., abych zjistil, kde je nejvíc chyb v generování 
 +  * Generování 
 +    * ReverseNumberNounDependency a "málo" ("nejméně dvouprocentní růst"), "%"
 +  * Wackernagel: "Nebyli se nuceni přepychu vzdát"
 +  * n:na+6 & jenž = na jehož 
 +  * mozna nejake prunovani kandidatu na RelClauseCoref, nebo se zeptat Michala, jestli nema neco lepsiho (ted se neresi rodtakze vznikaji blbosti). 
 +  * ma v umyslu -> v umyslu ma ... co je to za nesmysl? 
 +  * nejak resit "quot"? 
 +  * "jako vyzvu" - "n:jako+2" i kdyz je vyzvu nastavene spravne ... divne 
 +  * "gen Ester" dává jen chemiiproč ? (obecně má "gen" problémy s uppercasovanými lemmaty) 
 + 
 +==== Analýza ====
   * Analýza   * Analýza
     * AuxY     * AuxY
     * "se" s funktorem "???"     * "se" s funktorem "???"
-  * Generování +  * formémy -- viz [[user:dusek:formemy#todo|TODO ve formémech]] 
-    ReverseNumberNounDependency a "málo" ("nejméně dvouprocentní růst"), "%")+  vybufetit starý scénář analýzy (z SVNa naparsovat + archivovat PDT s 1.1a. a 2. verzí formémů 
 +  * slučování formémů 
 +==== Překlad ==== 
 +  * nové formémy v překladu 
 +==== ML modely ====
   * funktory   * funktory
     * bag of words jako možná featura, případně s filtrováním interpunkce apod.     * bag of words jako možná featura, případně s filtrováním interpunkce apod.
-  * formémy -- viz [[user:dusek:formemy#todo|TODO ve formémech]] 
-  * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných) 
   * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru   * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru
-  * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů 
   * zmenšit filtrování a zkusit funktory   * zmenšit filtrování a zkusit funktory
-  * přepsat BLEU na možnost paralelizace 
-    * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu) 
   * verze bez :X formémů   * verze bez :X formémů
   * binarizované verze pokusů   * binarizované verze pokusů
 +    * proč set-aware nepomáhá ?
   * nové featury do funktorů   * nové featury do funktorů
-  * slučování formémů +  * znovu zprovoznit AverageAttributeRanks, aby bylo možné použít mrel
-  * nové formémy v překladu+
   * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock   * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock
   * sčítání modelů   * sčítání modelů
 +
 +==== Util ====
 +  * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných)
 +  * přepsat BLEU na možnost paralelizace
 +    * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)
   * AttributeStats -> Print::   * AttributeStats -> Print::
-  * znovu zprovoznit AverageAttributeRanks, aby bylo možné použít mrel 
   * LayerAttributes: přidat wild atributy a libovolný kód   * LayerAttributes: přidat wild atributy a libovolný kód
     * přes ':' nebo tak něco ? hlavně v kódu dát pozor na '->', které něco znamená (a vlastně i na mezery; chtělo by nějak obalit)     * přes ':' nebo tak něco ? hlavně v kódu dát pozor na '->', které něco znamená (a vlastně i na mezery; chtělo by nějak obalit)
     * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)     * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)
  
 +
 +===== Vyzkoušet =====
 +  * Geneva parser
 +  * JANE – RWTH Aachen
 ===== Ostatní ===== ===== Ostatní =====
   * [[user:dusek:rants|Rants]]   * [[user:dusek:rants|Rants]]
   * [[user:dusek:tahaky|Taháky]]   * [[user:dusek:tahaky|Taháky]]
   * [[internal:user:dusek:napady|Nápady]]   * [[internal:user:dusek:napady|Nápady]]
- +  * [[internal:user:dusek:whereiswhat|Where is what]] 
 +  * [[user:dusek:python|Python]]

[ Back to the navigation ] [ Back to the content ]