Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
user:dusek:start [2011/10/31 11:10] dusek |
user:dusek:start [2013/04/12 14:37] (current) dusek |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| - | ==== Ondřej Dušek ==== | + | ====== Ondřej Dušek |
| [[http:// | [[http:// | ||
| - | === Projekty | + | ===== Projekty ===== |
| - | == Generování češtiny (FAUST) == | + | |
| + | ==== Vystadial ==== | ||
| + | * [[user: | ||
| + | |||
| + | ==== Generování češtiny (FAUST) | ||
| * [[user: | * [[user: | ||
| * [[user: | * [[user: | ||
| Line 13: | Line 17: | ||
| * [[user: | * [[user: | ||
| - | == CzEng == | + | ==== CzEng 1.0 ==== |
| * [[user: | * [[user: | ||
| * [[user: | * [[user: | ||
| + | * [[user: | ||
| - | === TO-DO list === | + | ==== WMT 12 ==== |
| + | * [[user: | ||
| + | * [[internal: | ||
| - | | + | ==== PhD ==== |
| - | * ANGLICKÉ FORMÉMY | + | |
| - | * parsování | + | * [[internal: |
| + | * [[internal: | ||
| + | |||
| + | ===== TO-DO list ===== | ||
| + | ==== Generování ==== | ||
| + | * verbal | ||
| + | * připojování dětí - nejak vylepsit, asi nejak statisticky (?) | ||
| + | * falesna zlata a-rovina | ||
| + | * rozgenerovavani viceslovnych t-lemmat (do budoucna by se stejne hodilo) | ||
| + | * oprava tagu podle t-roviny ? na a-rovine " | ||
| + | * podivne chovani zavorek -- spravit | ||
| + | * DeleteGeneratedNodes možná maže víc, než je nutné (wsj_0155## | ||
| + | * dopsat do evaluace něco, co bude koukat na chyby a zjišťovat jejich atributy nezávisle na atributech rodiče | ||
| + | * to pak použít s odkazem na automatické afuny, lemmata apod., abych zjistil, kde je nejvíc chyb v generování | ||
| + | * Generování | ||
| + | * ReverseNumberNounDependency a " | ||
| + | * Wackernagel: | ||
| + | * n:na+6 & jenž = na jehož | ||
| + | * mozna nejake prunovani kandidatu na RelClauseCoref, | ||
| + | * ma v umyslu -> v umyslu ma ... co je to za nesmysl? | ||
| + | * nejak resit " | ||
| + | * "jako vyzvu" - " | ||
| + | * "gen Ester" dává jen chemii, proč ? (obecně má " | ||
| + | |||
| + | ==== Analýza ==== | ||
| + | * Analýza | ||
| + | * AuxY | ||
| + | * " | ||
| + | * formémy -- viz [[user: | ||
| + | * vybufetit starý scénář analýzy (z SVN) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů | ||
| + | * slučování formémů | ||
| + | ==== Překlad ==== | ||
| + | * nové formémy v překladu | ||
| + | ==== ML modely ==== | ||
| + | * funktory | ||
| + | * bag of words jako možná featura, případně s filtrováním interpunkce apod. | ||
| * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru | * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru | ||
| - | * nový model: počkat chvíli a pak zkopírovat modely na správné umístění | + | * zmenšit filtrování |
| - | * opravit modely (vyhodit nebinarizované) | + | |
| - | * vybufetit starý scénář analýzy (možná z treex/ | + | |
| - | * dohodnout se s Pepou na formémech v PCEDT | + | |
| - | * model pro koordinační hlavy | + | |
| - | * model pro angličtinu | + | |
| - | * test na overtraining (hodnocení trén. dat) | + | |
| - | * jsou " | + | |
| - | * nové writery | + | |
| - | * přepsat BLEU na možnost paralelizace | + | |
| - | * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu) | + | |
| * verze bez :X formémů | * verze bez :X formémů | ||
| * binarizované verze pokusů | * binarizované verze pokusů | ||
| + | * proč set-aware nepomáhá ? | ||
| * nové featury do funktorů | * nové featury do funktorů | ||
| - | * slučování formémů | + | * znovu zprovoznit AverageAttributeRanks, |
| - | * nové formémy v překladu | + | |
| - | * přeznačkovat CzEng ? | + | |
| * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock | * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock | ||
| * sčítání modelů | * sčítání modelů | ||
| + | |||
| + | ==== Util ==== | ||
| + | * qload -- u machines free filtr na ty, které mají volné sloty (k čemu je, že na iridiu je půl paměti volné, když je všech 16 slotů zabraných) | ||
| + | * přepsat BLEU na možnost paralelizace | ||
| + | * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu) | ||
| * AttributeStats -> Print:: | * AttributeStats -> Print:: | ||
| - | * znovu zprovoznit AverageAttributeRanks, | ||
| * LayerAttributes: | * LayerAttributes: | ||
| * přes ':' | * přes ':' | ||
| Line 49: | Line 84: | ||
| - | === Rants === | + | ===== Vyzkoušet |
| - | == PDT == | + | * Geneva parser |
| - | * //aby, kdyby// -- proč je tense=ant, verbmod=ind (proti //by//, kde je tense=sim, verbmod=cdn) | + | * JANE – RWTH Aachen |
| - | * proč se nerozlišuje epistemická modalita? | + | ===== Ostatní ===== |
| - | * proč není v popisu PDT u morfologie uvedený P1 a A2 ? | + | * [[user: |
| - | + | * [[user: | |
| - | == Morfoanalýza == | + | * [[internal: |
| - | * proč se neurčuje A2 u česko - slovenský apod. ? | + | * [[internal: |
| - | * Havlíčkův-2, | + | * [[user: |
| + | * [[internal: | ||
