This is an old revision of the document!
Ondřej Dušek
Projekty -- popisky
Generování češtiny (FAUST)
- reordering
- hodnocení nejen BLEU nad původními větami, ale taky jazykovým modelem
- to bude lepší pro zhodnocení, jestli je výsledná čeština čitelná
CzEng
TO-DO list
- PROČ COAP MODEL ROZHAZUJE DATA ?
- ANGLICKÉ FORMÉMY
- nový model: počkat chvíli a pak zkopírovat modely na správné umístění
- opravit modely (vyhodit nebinarizované)
- vybufetit starý scénář analýzy (možná z treex/devel/analysis/cs, tam pak aktualizovat) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů
- dohodnout se s Pepou na formémech v PCEDT
- model pro koordinační hlavy
- model pro angličtinu
- test na overtraining (hodnocení trén. dat)
- jsou “jako” a “než” v překladových modelech?
- nové writery
- přepsat BLEU na možnost paralelizace
- rollout všech paralelních verzí (a asi někam i toho zobacího skriptu)
- verze bez :X formémů
- binarizované verze pokusů
- nové featury do funktorů
- slučování formémů
- nové formémy v překladu
- přeznačkovat CzEng ?
- přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock
- sčítání modelů
- AttributeStats → Print::
- znovu zprovoznit AverageAttributeRanks, aby bylo možné použít mrel
- LayerAttributes: přidat wild atributy a libovolný kód
- přes ':' nebo tak něco ? hlavně v kódu dát pozor na '→', které něco znamená (a vlastně i na mezery; chtělo by nějak obalit)
- v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)
Rants
PDT
- aby, kdyby – proč je tense=ant, verbmod=ind (proti by, kde je tense=sim, verbmod=cdn)
- proč se nerozlišuje epistemická modalita?
- proč není v popisu PDT u morfologie uvedený P1 a A2 ?
Morfoanalýza
- proč se neurčuje A2 u česko - slovenský apod. ?
- Havlíčkův-2, Romeův, Richterův, Poův / Poeův, Káňův, Hubbleův (a možná další)