Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Last revision Both sides next revision | ||
user:zeman:giza [2009/06/03 12:07] zeman Jednotlivé trénovací kroky. |
user:zeman:giza [2009/06/03 15:31] zeman Moje pokusné volání. |
||
---|---|---|---|
Line 47: | Line 47: | ||
Ohlásilo to, že z 50000 vět zbylo 42737. | Ohlásilo to, že z 50000 vět zbylo 42737. | ||
+ | |||
Line 59: | Line 60: | ||
Než zavoláme Gizu, musíme mít z nějakého důvodu hotový [[SRILM|jazykový model]]< | Než zavoláme Gizu, musíme mít z nějakého důvodu hotový [[SRILM|jazykový model]]< | ||
+ | |||
+ | Pro konkrétní pokusy s hindštinou už mám upravené volání Gizy++ nachystané ve skriptu '' | ||
Moses obsahuje skript, který hezky obaluje volání mkcls a Gizy++ a generuje frázové a přeskládávací tabulky, které potřebuje dekodér. Volá se takhle (pozor, cesta k jazykovému modelu musí být **absolutní**): | Moses obsahuje skript, který hezky obaluje volání mkcls a Gizy++ a generuje frázové a přeskládávací tabulky, které potřebuje dekodér. Volá se takhle (pozor, cesta k jazykovému modelu musí být **absolutní**): | ||
Line 88: | Line 91: | ||
Pokud to děláme kvůli Joshuovi, potřebujeme pustit jen prvních pár kroků. | Pokud to děláme kvůli Joshuovi, potřebujeme pustit jen prvních pár kroků. | ||
+ | **Pozor!** Jestliže pustíme Gizu opakovaně ve stejné složce, bude mít tendenci využít staré mezisoubory a nevytvářet je znova, aby ušetřila čas. To ale není vždy žádoucí! Jestliže jsme např. měli vedle sebe dvě verze korpusu, train.lowercased (50000 vět na každé straně) a train.clean (podmnožina 42737 vět na každé straně), nejdříve jsme pustili Gizu na train.lowercased a pak jsme si vzpomněli, že jsme vlastně chtěli train.clean, |