Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
user:zeman:joshua [2009/06/01 16:51] zeman Instalace SRILM. |
user:zeman:joshua [2009/06/01 21:32] zeman Testování. |
* Soubory ''INSTALL'' a ''README'' přímo v balíčku s Joshuou. | * Soubory ''INSTALL'' a ''README'' přímo v balíčku s Joshuou. |
| |
===== Instalace SRILM ===== | ===== Instalace ===== |
| |
SRILM je nástroj pro jazykové modelování, se kterým pracují mnohé překladače včetně Mosese a Joshuy. Je napsaný v céčku. Způsob, jak ho získat a přeložit, je popsaný v tutoriálu k Mosesovi. Není tam popsaný akorát tento zádrhel: z neznámých důvodů SRILM očekává grafickou knihovnu TCL. Pokud tato knihovna není k dispozici, musíme mu říct, že se na ni má vykašlat. K tomu je potřeba ve složce SRILM vlézt do common, najít dílčí Makefile pro naši architekturu, otevřít ho v nějakém editoru a upravit 3 řádky: zakomentovat 2 začínající na TCL a zajistit, že je tam ten třetí (NO_TCL): | Prerekvizity: |
| * Ant: kompilátor a make Javy. Máme ho v ''/usr/bin/ant'' |
| * Swig: nástroj na propojení kódu napsaného v různých jazycích, v tomto případě Joshuy (Java) na SRILM (céčko). Máme ho v ''/usr/bin/swig'' |
| * [[SRILM]]: nástroj Andrease Stolckeho na trénování a používání jazykových modelů, běžně používaný se strojovými překladači, jako je Pharaoh, Hiero, Moses, Joshua. Máme nainstalováno nejspíš mnohokrát, v podstatě si každý instaluje svou kopii. Podrobnosti o instalaci viz odkaz na začátku tohoto bodu. Pozor, aby instalace fungovala na stroji (architektuře), na kterém chceme překládat (podrobnosti viz tamtéž). |
| |
<code># Tcl support (standard in Linux) | Nastavit důležité proměnné (to by se hodilo přidat do ''.cshrc'' nebo nějakého podobného konfiguračního souboru). |
# TCL_INCLUDE = | |
# TCL_LIBRARY = -ltcl | |
NO_TCL = x</code> | |
| |
===== Instalace ===== | <code>setenv JAVA_HOME /opt/jdk1.6 |
| setenv SRILM /home/zeman/nastroje/srilm |
Pozor, aby to běželo na clusteru LRC, je potřeba to překládat pro 64bitovou architekturu. V nejhorším případě přímo na clusteru samém. | setenv JOSHUA_HOME /net/work/people/zeman/joshua</code> |
| |
Stáhnout aktuální verzi Joshuy: | Stáhnout aktuální verzi Joshuy: |
| |
<code>cd /net/work/people/zeman/joshua | <code>cd $JOSHUA_HOME |
svn co https://joshua.svn.sourceforge.net/svnroot/joshua/trunk joshua</code> | svn co https://joshua.svn.sourceforge.net/svnroot/joshua/trunk joshua</code> |
| |
Nastavit důležité proměnné (to by se hodilo přidat do ''.cshrc'' nebo nějakého podobného konfiguračního souboru) a zkontrolovat, že máme nainstalované prerekvizity. Ant je překladač nebo spíš make pro Javu. Swig je nástroj, který umí propojovat kód napsaný v různých jazycích, v tomto případě jde o napojení céčkového SRILM (jazykové modelování) na zbytek Joshuy, který je v Javě. | Přeložit Joshuu: |
| |
<code>setenv JAVA_HOME /opt/jdk1.6 | <code>cd $JOSHUA_HOME |
which ant # /usr/bin/ant | ant compile</code> |
which swig # /usr/bin/swig | |
# install SRILM</code> | Kdyby bylo potřeba v budoucnosti překompilovat Joshuu načisto, již zkompilované moduly se dají odstranit pomocí |
| |
| <code>ant clean</code> |
| |
| Otestujeme, že je Joshua funkční: |
| |
| <code>ant test |
| ./example/decode_example_javalm.sh |
| ./example/decode_example_srilm.sh</code> |