Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:giza [2009/06/02 16:25] zeman Drobná chyba v cestě. |
user:zeman:giza [2009/06/03 12:07] zeman Jednotlivé trénovací kroky. |
||
---|---|---|---|
Line 47: | Line 47: | ||
Ohlásilo to, že z 50000 vět zbylo 42737. | Ohlásilo to, že z 50000 vět zbylo 42737. | ||
+ | |||
Line 72: | Line 73: | ||
Uvedený skript se mi zasekl krátce před vytvořením vlastního symetrického párování, | Uvedený skript se mi zasekl krátce před vytvořením vlastního symetrického párování, | ||
+ | |||
+ | Uvedený trénovací skript Mosese má na starosti mnohem více úkonů než jen volání Gizy. Úkony jsou rozdělené do kroků a můžeme provést jen některé kroky. Kroky jsou následující: | ||
+ | |||
+ | - prepare() - pracuje s faktory, nahrazuje slova v korpusu číselnými odkazy do slovníku, volá '' | ||
+ | - run_giza() - pustí paralelně 2 alignovací procesy, ze zdroje na cíl a z cíle na zdroj | ||
+ | - word_align() - zkombinuje výsledky obou Giz, aby získal jedno slovní párování. Volá '' | ||
+ | - get_lexical_factored() | ||
+ | - extract_phrase_factored() | ||
+ | - score_phrase_factored() | ||
+ | - get_reordering_factored() | ||
+ | - get_generation_factored() | ||
+ | - create_ini() | ||
+ | |||
+ | Pokud to děláme kvůli Joshuovi, potřebujeme pustit jen prvních pár kroků. | ||
+ |