Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:wmt [2013/04/16 11:14] zeman Anglický Gigaword. |
user:zeman:wmt [2013/04/16 13:45] zeman Verze Gigawordů ověřeny. |
||
---|---|---|---|
Line 11: | Line 11: | ||
* Všechny překlady do angličtiny zopakovat s Gigawordem. | * Všechny překlady do angličtiny zopakovat s Gigawordem. | ||
* Pokračovat v práci na gigafren. Překladový model je natrénovaný, | * Pokračovat v práci na gigafren. Překladový model je natrénovaný, | ||
+ | * Počkat, až bude hotový jazykový model z anglického Gigawordu, abychom nemuseli zase něco jednorázově odkládat. | ||
* Pro oba směry (en-fr a fr-en) chci překlad s Gigawordem i bez něj, tj. TM: | * Pro oba směry (en-fr a fr-en) chci překlad s Gigawordem i bez něj, tj. TM: | ||
* Pak chci ještě totéž, ale překladový model je kombinovaný s newseuro, případně i s un (ale un to asi moc nevylepší a bude to nezvladatelně veliké). | * Pak chci ještě totéž, ale překladový model je kombinovaný s newseuro, případně i s un (ale un to asi moc nevylepší a bude to nezvladatelně veliké). | ||
- | * Dokončit pokusy s korpusy un.es-en a un.fr-en. Běží merty, pak translate a evaluator. Pak kombinace un s jinými korpusy (newseuro a newsall). | + | * Dokončit pokusy s korpusy un.es-en a un.fr-en. |
- | * Pokusy s překladovým modelem pouze na UN doběhly a moc se nevyznamenaly. Bez ohledu na to, že jazykový model obsahoval newsall i gigaword. | + | * Vyrobit |
- | * Ještě je ale potřeba vyzkoušet | + | * Až bude také k dispozici jazykový model z anglického Gigawordu, pustit model, mert, translate a evaluator. |
* Obdobně mi chybí výsledky pro kombinaci Czengu a newseuro (oba směry en-cs i cs-en). | * Obdobně mi chybí výsledky pro kombinaci Czengu a newseuro (oba směry en-cs i cs-en). | ||
+ | * Slepit korpusy a alignmenty, vyrobit kombinovaný překladový model. | ||
+ | * Až bude také k dispozici jazykový model z anglického Gigawordu, pustit model, mert, translate a evaluator. | ||
* Zkontrolovat data pro rok 2013. | * Zkontrolovat data pro rok 2013. | ||
* Nejsou náhodou letos nové verze korpusů newseuro a newsall? | * Nejsou náhodou letos nové verze korpusů newseuro a newsall? | ||
Line 24: | Line 27: | ||
* Navíc je úplně nový korpus Common Crawl (prý je ale špinavý). | * Navíc je úplně nový korpus Common Crawl (prý je ale špinavý). | ||
* Nové by mělo být i newsall, protože přibyl rok 2012. | * Nové by mělo být i newsall, protože přibyl rok 2012. | ||
- | * Používám správné | + | * Gigawordy používám správné |
* O ruštině nemluvě... | * O ruštině nemluvě... | ||
* Proč při překladu odkudkoliv do angličtiny to s jazykovým modelem na newsall dopadne malinko hůř než bez něj? Nemělo by to spíš dopadnout zřetelně líp? Co je s ním? Jak je velký? Jakou dostal váhu? Jak se po jeho přidání změnil výstup překladu? | * Proč při překladu odkudkoliv do angličtiny to s jazykovým modelem na newsall dopadne malinko hůř než bez něj? Nemělo by to spíš dopadnout zřetelně líp? Co je s ním? Jak je velký? Jakou dostal váhu? Jak se po jeho přidání změnil výstup překladu? |