Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:morpho-challenge-2008 [2008/06/27 17:15] zeman Zpracování převrácených slov. |
user:zeman:morpho-challenge-2008 [2008/06/27 22:25] zeman Postřehy. |
||
---|---|---|---|
Line 79: | Line 79: | ||
foreach l (ar de en fi tr) | foreach l (ar de en fi tr) | ||
$MC/ | $MC/ | ||
- | qsub.csh mc_jazyk.csh $l.rev | + | qsub.csh |
end</ | end</ | ||
< | < | ||
- | cat $l.rev.kmeny.txt | perl -pe ' | + | cat $l.rev.kmeny.txt | $MC/ |
- | cat $l.rev.koncovky.txt | perl -pe ' | + | cat $l.rev.koncovky.txt | $MC/ |
+ | $MC/ | ||
end</ | end</ | ||
Line 96: | Line 97: | ||
* Odeslat výsledky Mikkovi. | * Odeslat výsledky Mikkovi. | ||
+ | ===== Postřehy ===== | ||
+ | |||
+ | Předpony, zdá se, fungují, ale na rozdíl od přípon by to tu nechtělo dávat společná písmena ke kmeni, nýbrž k& | ||
+ | |||
+ | Jednopísmenné předpony jsou problém. Nemůžu je úplně zakázat (české //o-, u-//), ale ve výstupu se mi nezdravě množí. | ||
+ | |||
+ | Segmentaci dělám hladově, i když by to chtělo chart parser. Problém: máme 2 seznamy kmenů (jeden zbytky po předponách, | ||
+ | |||
+ | Algoritmus 3 (předpony + kmeny + přípony) nedělá to, co má. Jaktože nepoznal vzor //abrupt - abruptly - abruptness//, |