[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:wmt [2013/04/15 12:14]
zeman Odstraněn duplicitní úkol.
user:zeman:wmt [2013/04/16 11:26]
zeman Upřesnění aktuálních úkolů.
Line 7: Line 7:
 ===== Aktuální úkoly ===== ===== Aktuální úkoly =====
  
-  * Znova označkovat anglický Gigaword, tentokrát Featuramou+  * Dohnat pokusy s anglickým Gigawordem
-    * Označkováno už je, dva dílčí dokumenty se musely značkovat dodatečně. Nyní (pondělí 15.4.2013) běží slévání výstupu. +    * Vyrábí se jazykový model z anglického Gigawordu (od 11:14 úterý 16.4.2013).
-    * Vyrobit jazykový model z anglického Gigawordu (předtím se ještě bude sto let vyrábět faktor stc, tak bacha, zablokuje to konzoli).+
     * Všechny překlady do angličtiny zopakovat s Gigawordem.     * Všechny překlady do angličtiny zopakovat s Gigawordem.
   * Pokračovat v práci na gigafren. Překladový model je natrénovaný, je potřeba vyrobit kroky model, mert, translate a evaluator.   * Pokračovat v práci na gigafren. Překladový model je natrénovaný, je potřeba vyrobit kroky model, mert, translate a evaluator.
-  Dokončit pokusy s korpusy un.es-en un.fr-en. Běží mertypak translate a evaluator. Pak kombinace un s jinými korpusy (newseuro a newsall)+    Počkat, až bude hotový jazykový model z anglického Gigaworduabychom nemuseli zase něco jednorázově odkládat
-    * Pokusy s ekladovým modelem pouze na UN doběhly a moc se nevyznamenalyBez ohledu na tože jazykový model obsahoval newsall gigaword. +    * Pro oba směry (en-fr a fr-en) chci eklad s Gigawordem i bez něj, tjTM:gigafrenLM:gigafren + newsall [+ gigaword]
-    * Ještě je ale potřeba vyzkoušet kombinovaný překladový model (newseuro+un). Ten byl na minulém hřišti úspěšný.+    * Pak chci ještě totéž, ale překladový model je kombinovaný s newseuro, případně i s un (ale un to asi moc nevylepší a bude to nezvladatelně veliké). 
 +  * Dokončit pokusy s korpusy un.es-en a un.fr-en. 
 +    * Vyrobit kombinovaný překladový model (newseuro+un). Ten byl na minulém hřišti úspěšný
 +    * Až bude také k dispozici jazykový model z anglického Gigawordu, pustit model, mert, translate a evaluator. 
 +  * Obdobně mi chybí výsledky pro kombinaci Czengu a newseuro (oba směry en-cs i cs-en). 
 +    * Slepit korpusy a alignmenty, vyrobit kombinovaný překladový model. 
 +    * Až bude také k dispozici jazykový model z anglického Gigawordu, pustit model, mert, translate a evaluator.
   * Zkontrolovat data pro rok 2013.   * Zkontrolovat data pro rok 2013.
     * Nejsou náhodou letos nové verze korpusů newseuro a newsall?     * Nejsou náhodou letos nové verze korpusů newseuro a newsall?

[ Back to the navigation ] [ Back to the content ]