Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:moses [2008/12/15 15:44] zeman Checkout se povedl. |
user:zeman:moses [2008/12/15 21:45] zeman File::NFSLock. |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Ondrův návod, jak pouštět Mosese ====== | ====== Ondrův návod, jak pouštět Mosese ====== | ||
+ | |||
+ | ===== Instalace ===== | ||
<code bash>svn co https:// | <code bash>svn co https:// | ||
Line 5: | Line 7: | ||
Poznámka Dan: mám to v ''/ | Poznámka Dan: mám to v ''/ | ||
- | < | + | < |
cd moses_playground/ | cd moses_playground/ | ||
- | ln -s / | + | ln -s / |
+ | Je to tam. | ||
- | # ostatni komponenty jsou bud v svn nebo se stahnou | + | <code bash># ostatni komponenty jsou bud v svn nebo se stahnou |
# zkompiluj vse | # zkompiluj vse | ||
cd moses_playground | cd moses_playground | ||
- | make workspace | + | make workspace</code> |
- | # vyrobi to podadresar workspace.DATUM-CAS, | + | |
- | # nastav cesty v playground/Makefile | + | |
- | # priprav korpusy: | + | Pro jistotu pouštím na '' |
- | cd playground/ | + | < |
+ | | ||
+ | |||
+ | <code bash># vyrobi to podadresar workspace.DATUM-CAS, | ||
+ | # nastav cesty v moses_playground/ | ||
+ | |||
+ | Nastavuju cesty '' | ||
+ | |||
+ | ===== Příprava korpusů ===== | ||
+ | |||
+ | <code bash># priprav korpusy: | ||
+ | |||
+ | cd moses_playground/ | ||
# co (paralelni) korpus, to adresar | # co (paralelni) korpus, to adresar | ||
Line 29: | Line 42: | ||
mujkorpus/ | mujkorpus/ | ||
- | Priklad viz / | + | Priklad viz / |
- | Pak nechas vyrobit alignment, bud rucne, nebo napr.: | + | Nějaké podsložky už tam jsou. Vytvářím novou '' |
+ | |||
+ | **Před dalšími operacemi raději přepínám z tcsh do bashe, který používá Ondra.** | ||
+ | |||
+ | <code bash>Pak nechas vyrobit alignment, bud rucne, nebo napr.: | ||
cd augmented_corpora | cd augmented_corpora | ||
Line 43: | Line 60: | ||
(Vystup viz napr. / | (Vystup viz napr. / | ||
- | Princip je ten, ze pro kazdy korpus K maji vsechny soubory augmented_corpora/ | + | Princip je ten, ze pro kazdy korpus K maji vsechny soubory augmented_corpora/ |
+ | mit stejny pocet radek. Mohou mit ruzny pocet tokenu na radce.</ | ||
- | Pak je skript augment.pl, ktery podle navodu z daneho korpusu vyreze potrebne faktory, napr.: | + | Cíl '' |
+ | |||
+ | Pozor, tady už některé věci vyžadují úpravy, např. se tam přistupuje k '' | ||
+ | |||
+ | Vyžaduje se také perlový modul '' | ||
+ | |||
+ | <code bash>Pak je skript augment.pl, ktery podle navodu z daneho korpusu vyreze potrebne faktory, napr.: | ||
cd augmented_corpora | cd augmented_corpora | ||
./ | ./ | ||
- | Pozor: v soucasne dobe stale jeste nefunguji zamky v augment.pl a NFS je debilni. Muze se tedy stat, ze kdyz ma augment vyrobit nejakou novou kombinaci, ktera se sklada z take vyrabenych soucastek, tak se vyrobi neuplne gzipy! | + | Pozor: v soucasne dobe stale jeste nefunguji zamky v augment.pl a NFS je debilni. |
+ | Muze se tedy stat, ze kdyz ma augment vyrobit nejakou novou kombinaci, | ||
+ | ktera se sklada z take vyrabenych soucastek, tak se vyrobi neuplne gzipy! | ||
+ | |||
+ | To byla priprava. : | ||
- | To byla priprava. :-) | + | Z tohohle to skoro vypadá, že se augment má pouštět před alignem, a ne až po něm. Z Makefilu je ale vidět, že se volání augmentu předává jako parametr alignu, který si ho zřejmě obsluhuje sám. |
+ | ===== Pouštění pokusů ===== | ||
- | Samotne pokusy pak pripravuji a spoustim takto: | + | <code bash>Samotne pokusy pak pripravuji a spoustim takto: |
cd playground | cd playground |