Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:giza [2009/06/02 11:34] zeman Lowercasing. |
user:zeman:giza [2009/06/02 11:37] zeman Z. |
||
---|---|---|---|
Line 21: | Line 21: | ||
Zdá se, že nástroje přeložené na 32bitové pracovní stanici s Ubuntu lze spustit i na clusteru. | Zdá se, že nástroje přeložené na 32bitové pracovní stanici s Ubuntu lze spustit i na clusteru. | ||
+ | |||
+ | |||
===== Příprava dat ===== | ===== Příprava dat ===== | ||
Line 31: | Line 33: | ||
Následující příklady jsou přímo z práce s hindštinou (TIDES). Převádění velkých písmen na malá by pravděpodobně stačilo provést pro angličtinu (hindština velká a malá písmena nerozlišuje), | Následující příklady jsou přímo z práce s hindštinou (TIDES). Převádění velkých písmen na malá by pravděpodobně stačilo provést pro angličtinu (hindština velká a malá písmena nerozlišuje), | ||
- | < | + | < |
+ | cd / | ||
cp $DATA/ | cp $DATA/ | ||
cp $DATA/ | cp $DATA/ | ||
Line 37: | Line 40: | ||
$MOSES/ | $MOSES/ | ||
+ | Zvláštní. Diff se tváří, že hindská data se lowercasingem opravdu změnila, a změněných řádků není málo. Většinou obsahují latinské písmeno " |