Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:dusek:start [2011/09/29 14:47] dusek |
user:dusek:start [2013/04/12 14:37] (current) dusek |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ==== Ondřej Dušek ==== | + | ====== Ondřej Dušek |
[[http:// | [[http:// | ||
- | === Projekty === | + | ===== Projekty |
- | == Generování češtiny (FAUST) == | + | |
+ | ==== Vystadial ==== | ||
+ | * [[user: | ||
+ | |||
+ | ==== Generování češtiny (FAUST) ==== | ||
+ | * [[user: | ||
* [[user: | * [[user: | ||
* [[user: | * [[user: | ||
+ | * reordering | ||
+ | * hodnocení nejen BLEU nad původními větami, ale taky jazykovým modelem | ||
+ | * to bude lepší pro zhodnocení, | ||
+ | * [[user: | ||
+ | * [[user: | ||
- | == CzEng == | + | ==== CzEng 1.0 ==== |
* [[user: | * [[user: | ||
* [[user: | * [[user: | ||
+ | * [[user: | ||
- | === TO-DO list === | + | ==== WMT 12 ==== |
- | * Martin: shared_files_paths, writery, jak se trénuje | + | * [[user: |
- | * binarizované verze pokusů | + | * [[internal: |
- | * nové featury do funktorů | + | |
+ | ==== PhD ==== | ||
+ | * [[internal: | ||
+ | * [[internal: | ||
+ | * [[internal: | ||
+ | |||
+ | ===== TO-DO list ===== | ||
+ | ==== Generování ==== | ||
+ | * verbal | ||
+ | * připojování dětí - nejak vylepsit, asi nejak statisticky (?) | ||
+ | * falesna zlata a-rovina | ||
+ | * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo) | ||
+ | * oprava tagu podle t-roviny ? na a-rovine " | ||
+ | * podivne chovani zavorek -- spravit | ||
+ | * DeleteGeneratedNodes možná maže víc, než je nutné (wsj_0155## | ||
+ | * dopsat do evaluace něco, co bude koukat na chyby a zjišťovat jejich atributy nezávisle na atributech rodiče | ||
+ | * to pak použít s odkazem na automatické afuny, lemmata apod., abych zjistil, kde je nejvíc chyb v generování | ||
+ | * Generování | ||
+ | * ReverseNumberNounDependency a " | ||
+ | * Wackernagel: | ||
+ | * n:na+6 & jenž = na jehož | ||
+ | * mozna nejake prunovani kandidatu na RelClauseCoref, | ||
+ | * ma v umyslu -> v umyslu ma ... co je to za nesmysl? | ||
+ | * nejak resit " | ||
+ | * "jako vyzvu" - " | ||
+ | * "gen Ester" dává jen chemii, proč ? (obecně má " | ||
+ | |||
+ | ==== Analýza ==== | ||
+ | * Analýza | ||
+ | * AuxY | ||
+ | * " | ||
+ | * formémy -- viz [[user: | ||
+ | * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů | ||
* slučování formémů | * slučování formémů | ||
+ | ==== Překlad ==== | ||
* nové formémy v překladu | * nové formémy v překladu | ||
- | | + | ==== ML modely ==== |
+ | | ||
+ | * bag of words jako možná featura, | ||
+ | * dovolit u weka-classifieru | ||
+ | * zmenšit filtrování a zkusit funktory | ||
+ | * verze bez :X formémů | ||
+ | * binarizované verze pokusů | ||
+ | * proč set-aware nepomáhá | ||
+ | * nové featury do funktorů | ||
+ | * znovu zprovoznit AverageAttributeRanks, | ||
+ | * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock | ||
* sčítání modelů | * sčítání modelů | ||
+ | |||
+ | ==== Util ==== | ||
+ | * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných) | ||
+ | * přepsat BLEU na možnost paralelizace | ||
+ | * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu) | ||
+ | * AttributeStats -> Print:: | ||
+ | * LayerAttributes: | ||
+ | * přes ':' | ||
+ | * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím) | ||
+ | |||
+ | |||
+ | ===== Vyzkoušet ===== | ||
+ | * Geneva parser | ||
+ | * JANE – RWTH Aachen | ||
+ | ===== Ostatní ===== | ||
+ | * [[user: | ||
+ | * [[user: | ||
+ | * [[internal: | ||
+ | * [[internal: | ||
+ | * [[user: | ||
+ | * [[internal: | ||