[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:moses [2008/12/15 16:44]
zeman Kompiluji.
user:zeman:moses [2008/12/15 17:15]
zeman Zkopírován korpus EILMT.
Line 1: Line 1:
 ====== Ondrův návod, jak pouštět Mosese ====== ====== Ondrův návod, jak pouštět Mosese ======
 +
 +===== Instalace =====
  
 <code bash>svn co https://svn.ms.mff.cuni.cz/svn/treedecode/moses_playground</code> <code bash>svn co https://svn.ms.mff.cuni.cz/svn/treedecode/moses_playground</code>
Line 16: Line 18:
 make workspace</code> make workspace</code>
  
-Pro jistotu pouštím na ''sol2'', aby měl make podobné 64bitové prostředí, jako bude mít Moses puštěný na clusteru.+Pro jistotu pouštím na ''sol2'', aby měl make podobné 64bitové prostředí, jako bude mít Moses puštěný na clusteru. Zdá se, že to proběhlo bez potíží, řeklo to: 
 + 
 +<code>## Don't forget to set your SCRIPTS_ROOTDIR with: 
 +   export SCRIPTS_ROOTDIR=/export/work/people/zeman/moses/moses_playground/workspace.20081215-1642/bin/scripts-20081215-1646</code>
  
 <code bash># vyrobi to podadresar workspace.DATUM-CAS, <code bash># vyrobi to podadresar workspace.DATUM-CAS,
-# nastav cesty v playground/Makefile+# nastav cesty v moses_playground/Makefile</code>
  
-# priprav korpusy:+Nastavuju cesty ''PWD'' a ''WS'' na začátku Makefilu. ''PWD'' vede na právě vytvořený ''moses_playground'', ''WS'' je název právě vytvořeného pracovního prostoru ''workspace.20081215-1642''.
  
-cd playground/augmented_corpora+ 
 +===== Příprava korpusů ===== 
 + 
 +<code bash># priprav korpusy: 
 + 
 +cd moses_playground/augmented_corpora
  
 # co (paralelni) korpus, to adresar # co (paralelni) korpus, to adresar
Line 33: Line 43:
 mujkorpus/en.info mujkorpus/en.info
  
-Priklad viz /home/bojar/diplomka/granty/euromatrix/moses_icon08/augmented_corpora/icon-eilmt+Priklad viz /home/bojar/diplomka/granty/euromatrix/moses_icon08/augmented_corpora/icon-eilmt</code> 
 + 
 +Nějaké podsložky už tam jsou. Vytvářím novou ''enhi-dan'' a kopíruju do ní Ondrovy příklady souborů .gz a .info. Tím jsem získal kopii anglicko-hindského korpusu EILMT (7000 vět). Korpus je tokenizovaný a spárovaný po větách.
  
-Pak nechas vyrobit alignment, bud rucne, nebo napr.:+<code bash>Pak nechas vyrobit alignment, bud rucne, nebo napr.:
  
 cd augmented_corpora cd augmented_corpora

[ Back to the navigation ] [ Back to the content ]