[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:start [2011/10/03 16:37]
dusek
user:dusek:start [2011/10/31 16:56]
dusek
Line 4: Line 4:
 === Projekty -- popisky === === Projekty -- popisky ===
 == Generování češtiny (FAUST) == == Generování češtiny (FAUST) ==
 +  * [[user:dusek:analyza|Česká analýza]]
   * [[user:dusek:formemy_gen|Automatická detekce formémů z funktorů]]   * [[user:dusek:formemy_gen|Automatická detekce formémů z funktorů]]
   * [[user:dusek:morpho_gen|Generování morfologických atributů z formémů a gramatémů]]   * [[user:dusek:morpho_gen|Generování morfologických atributů z formémů a gramatémů]]
 +  * reordering
 +  * hodnocení nejen BLEU nad původními větami, ale taky jazykovým modelem
 +    * to bude lepší pro zhodnocení, jestli je výsledná čeština čitelná
 +  * [[user:dusek:features|Seznam možných featur]]
 +  * [[user:dusek:gen-vysl|Výsledky]]
  
 == CzEng == == CzEng ==
Line 12: Line 18:
  
 === TO-DO list === === TO-DO list ===
-  Martin<del>shared_files_paths, writery</del>jak se trénuje eklad+ 
 +  ANGLICKÉ FORMÉMY 
 +  * dovolit u weka-classifieru číst nastavení klasifikátoru ze souboru 
 +  * nový modelpočkat chvíli a pak zkopírovat modely na správné umístění 
 +    * opravit modely (vyhodit nebinarizované) 
 +  * vybufetit starý scénář analýzy (možná z treex/devel/analysis/cstam pak aktualizovat) a naparsovat + archivovat PDT s 1., 1a. a 2. verzí formémů 
 +  * model pro angličtinu 
 +  * jsou "jako" a "než"ekladových modelech? 
 +  * nové writery 
 +  * přepsat BLEU na možnost paralelizace 
 +    * rollout všech paralelních verzí (a asi někam i toho zobacího skriptu) 
 +  * verze bez :X formémů
   * binarizované verze pokusů   * binarizované verze pokusů
   * nové featury do funktorů   * nové featury do funktorů
Line 18: Line 35:
   * nové formémy v překladu   * nové formémy v překladu
     * přeznačkovat CzEng ?     * přeznačkovat CzEng ?
 +  * přidat distribuce pravděpodobnosti a nějaké constrainty do MLProcessBlock
   * sčítání modelů   * sčítání modelů
 +  * AttributeStats -> Print::
 +  * znovu zprovoznit AverageAttributeRanks, aby bylo možné použít mrel
 +  * LayerAttributes: přidat wild atributy a libovolný kód
 +    * přes ':' nebo tak něco ? hlavně v kódu dát pozor na '->', které něco znamená (a vlastně i na mezery; chtělo by nějak obalit)
 +    * v zásadě stačí, aby to kódem nebo wild_attr muselo končit (mezery nevím)
 +
 +
 +=== Rants ===
 +== PDT ==
 +  * //aby, kdyby// -- proč je tense=ant, verbmod=ind (proti //by//, kde je tense=sim, verbmod=cdn)
 +  * proč se nerozlišuje epistemická modalita?
 +  * proč není v popisu PDT u morfologie uvedený P1 a A2 ?
 +
 +== Morfoanalýza ==
 +  * proč se neurčuje A2 u česko - slovenský apod. ?
 +  * Havlíčkův-2, Romeův, Richterův, Poův / Poeův, Káňův, Hubbleův (a možná další)
  

[ Back to the navigation ] [ Back to the content ]