Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:dusek:start [2011/10/03 16:37] dusek |
user:dusek:start [2011/10/31 11:10] dusek |
||
---|---|---|---|
Line 4: | Line 4: | ||
=== Projekty -- popisky === | === Projekty -- popisky === | ||
== Generování češtiny (FAUST) == | == Generování češtiny (FAUST) == | ||
+ | * [[user: | ||
* [[user: | * [[user: | ||
* [[user: | * [[user: | ||
+ | * reordering | ||
+ | * hodnocení nejen BLEU nad původními větami, ale taky jazykovým modelem | ||
+ | * to bude lepší pro zhodnocení, | ||
+ | * [[user: | ||
+ | * [[user: | ||
== CzEng == | == CzEng == | ||
Line 12: | Line 18: | ||
=== TO-DO list === | === TO-DO list === | ||
- | | + | |
+ | | ||
+ | * ANGLICKÉ FORMÉMY | ||
+ | * parsování - zrychlit | ||
+ | * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru | ||
+ | * nový model: počkat chvíli a pak zkopírovat modely na správné umístění | ||
+ | * opravit modely (vyhodit nebinarizované) | ||
+ | * vybufetit starý scénář analýzy (možná z treex/devel/ | ||
+ | * dohodnout | ||
+ | * model pro koordinační hlavy | ||
+ | * model pro angličtinu | ||
+ | * test na overtraining (hodnocení trén. dat) | ||
+ | * jsou " | ||
+ | * nové writery | ||
+ | * přepsat BLEU na možnost paralelizace | ||
+ | * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu) | ||
+ | * verze bez :X formémů | ||
* binarizované verze pokusů | * binarizované verze pokusů | ||
* nové featury do funktorů | * nové featury do funktorů | ||
Line 18: | Line 40: | ||
* nové formémy v překladu | * nové formémy v překladu | ||
* přeznačkovat CzEng ? | * přeznačkovat CzEng ? | ||
+ | * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock | ||
* sčítání modelů | * sčítání modelů | ||
+ | * AttributeStats -> Print:: | ||
+ | * znovu zprovoznit AverageAttributeRanks, | ||
+ | * LayerAttributes: | ||
+ | * přes ':' | ||
+ | * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím) | ||
+ | |||
+ | |||
+ | === Rants === | ||
+ | == PDT == | ||
+ | * //aby, kdyby// -- proč je tense=ant, verbmod=ind (proti //by//, kde je tense=sim, verbmod=cdn) | ||
+ | * proč se nerozlišuje epistemická modalita? | ||
+ | * proč není v popisu PDT u morfologie uvedený P1 a A2 ? | ||
+ | |||
+ | == Morfoanalýza == | ||
+ | * proč se neurčuje A2 u česko - slovenský apod. ? | ||
+ | * Havlíčkův-2, | ||