Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:morpho-challenge-2008 [2008/07/31 16:06] zeman Sjednotit označení koncovek. |
user:zeman:morpho-challenge-2008 [2008/07/31 16:30] zeman Chytřejší výběr segmentace. |
||
---|---|---|---|
Line 47: | Line 47: | ||
vzorfiltr.pl -okm en.kmeny.txt -okonc en.koncovky.txt < en.nefiltr > en.vzor</ | vzorfiltr.pl -okm en.kmeny.txt -okonc en.koncovky.txt < en.nefiltr > en.vzor</ | ||
Skript '' | Skript '' | ||
+ | |||
Line 65: | Line 66: | ||
V úvahu přichází několik stupňů přísnosti při aplikaci vzorů na morfematickou segmentaci: | V úvahu přichází několik stupňů přísnosti při aplikaci vzorů na morfematickou segmentaci: | ||
- Slovo rozdělit pouze v případě, že toto dělení bylo viděno v trénovacích datech a proniklo filtrem mezi výsledné vzory. Jinými slovy, kmen i koncovka musí být známé a navíc musely být viděny spolu. | - Slovo rozdělit pouze v případě, že toto dělení bylo viděno v trénovacích datech a proniklo filtrem mezi výsledné vzory. Jinými slovy, kmen i koncovka musí být známé a navíc musely být viděny spolu. | ||
+ | - Kmen a koncovka nemusely být viděny přímo spolu. Stačí, když byl kmen viděn s N jinými koncovkami, které se s hledanou koncovkou společně vyskytují alespoň v jednom vzoru. | ||
- Kmen i koncovka musí být známé, ale nemusely být viděny spolu. | - Kmen i koncovka musí být známé, ale nemusely být viděny spolu. | ||
- Známá je koncovka, kmen známý být nemusí. | - Známá je koncovka, kmen známý být nemusí. | ||
Line 147: | Line 149: | ||
* Vymyslet způsob, jak využít četnosti slovních tvarů, které jsme dostali s& | * Vymyslet způsob, jak využít četnosti slovních tvarů, které jsme dostali s& | ||
* Odeslat výsledky Mikkovi. | * Odeslat výsledky Mikkovi. | ||
+ | |||
Line 166: | Line 169: | ||
Vzhledem ke způsobu vyhodnocení, | Vzhledem ke způsobu vyhodnocení, | ||
+ | |||
+ | Jestliže slovo obsahuje pomlčku, je to téměř jistá hranice morfémů. | ||