Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:wmt [2013/04/16 13:45] zeman Verze Gigawordů ověřeny. |
user:zeman:wmt [2013/04/28 10:10] zeman Kombinace czengu a newseuro je hotová, byť se starým newseurem. |
||
---|---|---|---|
Line 16: | Line 16: | ||
* Dokončit pokusy s korpusy un.es-en a un.fr-en. | * Dokončit pokusy s korpusy un.es-en a un.fr-en. | ||
* Vyrobit kombinovaný překladový model (newseuro+un). Ten byl na minulém hřišti úspěšný. | * Vyrobit kombinovaný překladový model (newseuro+un). Ten byl na minulém hřišti úspěšný. | ||
- | * Až bude také k dispozici jazykový model z anglického Gigawordu, pustit model, mert, translate a evaluator. | ||
- | * Obdobně mi chybí výsledky pro kombinaci Czengu a newseuro (oba směry en-cs i cs-en). | ||
- | * Slepit korpusy a alignmenty, vyrobit kombinovaný překladový model. | ||
* Až bude také k dispozici jazykový model z anglického Gigawordu, pustit model, mert, translate a evaluator. | * Až bude také k dispozici jazykový model z anglického Gigawordu, pustit model, mert, translate a evaluator. | ||
* Zkontrolovat data pro rok 2013. | * Zkontrolovat data pro rok 2013. | ||
Line 24: | Line 21: | ||
* Europarl je stejný jako loni, tedy verze 7. | * Europarl je stejný jako loni, tedy verze 7. | ||
* U News Commentary to není jisté, spíš asi budou nové. | * U News Commentary to není jisté, spíš asi budou nové. | ||
- | * Korpus UN bude asi stejný, i když to na stránkách WMT výslovně nepíšou. | ||
- | * Navíc je úplně nový korpus Common Crawl (prý je ale špinavý). | ||
* Nové by mělo být i newsall, protože přibyl rok 2012. | * Nové by mělo být i newsall, protože přibyl rok 2012. | ||
+ | * Navíc je úplně nový korpus Common Crawl (prý je ale špinavý). | ||
* Gigawordy používám správné (ověřeno): | * Gigawordy používám správné (ověřeno): | ||
- | * O ruštině nemluvě... | + | * Korpus UN bude asi stejný, i když to na stránkách WMT výslovně nepíšou. |
+ | * Vůbec nemám nachystaná ruská data! | ||
* Proč při překladu odkudkoliv do angličtiny to s jazykovým modelem na newsall dopadne malinko hůř než bez něj? Nemělo by to spíš dopadnout zřetelně líp? Co je s ním? Jak je velký? Jakou dostal váhu? Jak se po jeho přidání změnil výstup překladu? | * Proč při překladu odkudkoliv do angličtiny to s jazykovým modelem na newsall dopadne malinko hůř než bez něj? Nemělo by to spíš dopadnout zřetelně líp? Co je s ním? Jak je velký? Jakou dostal váhu? Jak se po jeho přidání změnil výstup překladu? | ||
* danmake.pl na rozdíl od emana nerozlišuje kroky, které jsou OUTDATED nebo FAILED. Když mu eman select pro nějakou sadu požadavků najde několik kroků, z nichž první je nějak vadný a druhý je DONE, danmake klidně použije ten první a pak se diví. | * danmake.pl na rozdíl od emana nerozlišuje kroky, které jsou OUTDATED nebo FAILED. Když mu eman select pro nějakou sadu požadavků najde několik kroků, z nichž první je nějak vadný a druhý je DONE, danmake klidně použije ten první a pak se diví. |