Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:morpho-challenge-2008 [2008/06/27 16:58] zeman Segmentace hotová. |
user:zeman:morpho-challenge-2008 [2008/06/27 22:25] zeman Postřehy. |
||
---|---|---|---|
Line 72: | Line 72: | ||
$MC/ | $MC/ | ||
$MC/ | $MC/ | ||
+ | |||
+ | ===== Zpracování převrácených slov a hledání předpon ===== | ||
+ | |||
+ | < | ||
+ | cd $MC/ | ||
+ | foreach l (ar de en fi tr) | ||
+ | $MC/ | ||
+ | qsub.csh $MC/ | ||
+ | end</ | ||
+ | |||
+ | < | ||
+ | cat $l.rev.kmeny.txt | $MC/ | ||
+ | cat $l.rev.koncovky.txt | $MC/ | ||
+ | $MC/ | ||
+ | end</ | ||
===== Zbývá udělat ===== | ===== Zbývá udělat ===== | ||
Line 82: | Line 97: | ||
* Odeslat výsledky Mikkovi. | * Odeslat výsledky Mikkovi. | ||
+ | ===== Postřehy ===== | ||
+ | |||
+ | Předpony, zdá se, fungují, ale na rozdíl od přípon by to tu nechtělo dávat společná písmena ke kmeni, nýbrž k& | ||
+ | |||
+ | Jednopísmenné předpony jsou problém. Nemůžu je úplně zakázat (české //o-, u-//), ale ve výstupu se mi nezdravě množí. | ||
+ | |||
+ | Segmentaci dělám hladově, i když by to chtělo chart parser. Problém: máme 2 seznamy kmenů (jeden zbytky po předponách, | ||
+ | |||
+ | Algoritmus 3 (předpony + kmeny + přípony) nedělá to, co má. Jaktože nepoznal vzor //abrupt - abruptly - abruptness//, |