Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:morpho-challenge-2008 [2008/07/28 17:52] zeman Cesta, kam ukládat filtrované kmeny a koncovky, se teď zadává jinak. |
user:zeman:morpho-challenge-2008 [2008/07/31 13:35] zeman Přehození kapitol. |
||
---|---|---|---|
Line 61: | Line 61: | ||
$MC/ | $MC/ | ||
end</ | end</ | ||
- | |||
===== Úprava výstupu před odesláním ===== | ===== Úprava výstupu před odesláním ===== | ||
Line 78: | Line 77: | ||
$MC/ | $MC/ | ||
$MC/ | $MC/ | ||
- | |||
- | ===== Zpracování převrácených slov a hledání předpon ===== | ||
- | |||
- | < | ||
- | cd $MC/ | ||
- | foreach l (ar de en fi tr) | ||
- | $MC/ | ||
- | qsub.csh $MC/ | ||
- | end</ | ||
- | |||
- | < | ||
- | cat $l.rev.kmeny.txt | $MC/ | ||
- | cat $l.rev.koncovky.txt | $MC/ | ||
- | $MC/ | ||
- | end</ | ||
- | |||
- | ===== Zbývá udělat ===== | ||
- | |||
- | * Vyzkoušet skórování. | ||
- | * Pustit celý algoritmus na převrácená slova a získat předpony. | ||
- | * Zkusit rozpoznat složená slova, resp. složené kmeny. Pouze jednoduchý přístup, snažit se najít uvnitř kmenu jiný existující kmen tak, aby to, co zbyde, byl také existující kmen nebo složenina. | ||
- | * Vymyslet způsob, jak využít četnosti slovních tvarů, které jsme dostali s& | ||
- | * Odeslat výsledky Mikkovi. | ||
===== Skórování ===== | ===== Skórování ===== | ||
- | Organizátoři poskytli program '' | + | Organizátoři poskytli program '' |
Co ještě potřebujeme: | Co ještě potřebujeme: | ||
Line 128: | Line 104: | ||
$MC/ | $MC/ | ||
$MC/ | $MC/ | ||
+ | |||
+ | ===== Vyhodnocení ===== | ||
+ | |||
+ | Moje vyhodnocení se bude lišit od oficiálních výsledků soutěže, protože mám k dispozici gold standard jen pro 500 slov z každého jazyka. Na prvním místě uvádím své výsledky, vpravo pak oficiální výsledky zveřejněné na stránkách soutěže. | ||
+ | |||
+ | | Jazyk | F | P | R | Fo | Po | Ro | | ||
+ | | en | 48.56 | 53.39 | 44.53 | 46.90 | 52.98 | 42.07 | | ||
+ | | de | 27.67 | 30.28 | 25.47 | 36.98 | 53.12 | 28.37 | | ||
+ | | fi | 30.97 | 47.44 | 22.99 | 30.33 | 58.51 | 20.47 | | ||
+ | | tr | 32.68 | 59.46 | 22.53 | 29.23 | 65.81 | 18.79 | | ||
+ | | ar | 15.78 | 79.86 | 8.76 | 21.86 | 77.24 | 12.73 | | ||
+ | |||
+ | ===== Zpracování převrácených slov a hledání předpon ===== | ||
+ | |||
+ | < | ||
+ | cd $MC/ | ||
+ | foreach l (ar de en fi tr) | ||
+ | $MC/ | ||
+ | qsub.csh $MC/ | ||
+ | end</ | ||
+ | |||
+ | < | ||
+ | cat $l.rev.kmeny.txt | $MC/ | ||
+ | cat $l.rev.koncovky.txt | $MC/ | ||
+ | $MC/ | ||
+ | end</ | ||
+ | |||
+ | ===== Zbývá udělat ===== | ||
+ | |||
+ | * Vyzkoušet skórování. | ||
+ | * Pustit celý algoritmus na převrácená slova a získat předpony. | ||
+ | * Zkusit rozpoznat složená slova, resp. složené kmeny. Pouze jednoduchý přístup, snažit se najít uvnitř kmenu jiný existující kmen tak, aby to, co zbyde, byl také existující kmen nebo složenina. | ||
+ | * Vymyslet způsob, jak využít četnosti slovních tvarů, které jsme dostali s& | ||
+ | * Odeslat výsledky Mikkovi. | ||
===== Postřehy ===== | ===== Postřehy ===== |