Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
user:zeman:ukoly:nerizena-morfologicka-analyza [2007/11/08 00:01] zeman vytvořeno |
user:zeman:ukoly:nerizena-morfologicka-analyza [2013/10/08 08:12] (current) zeman quest |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== | + | ====== |
+ | {{template> | ||
- | Napište program v Perlu, který rozpozná různé tvary stejných slov v textu v libovolném jazyce, aniž by měl k dispozici morfologický slovník. | + | Napište program v Perlu, který rozpozná různé tvary stejných slov v textu v libovolném jazyce, aniž by měl k dispozici morfologický slovník. |
- | Nápověda: | + | K dispozici máte seznam slov daného jazyka nalezených v korpusu, včetně jejich četností. Seznam čtěte ze standardního vstupu. Na každém řádku je vždy nejdříve počet výskytů slova, pak mezera a za ní slovo. Předpokládejte, |
+ | |||
+ | Výstupem vašeho programu (pošlete ho na STDOUT) by měly být morfematické segmentace všech slov, která byla na vstupu, opět v UTF-8. Každé slovo má svůj řádek, na něm je uvedeno jako první položka (četnost slova už se na výstupu neobjeví). Následuje tabulátor (" | ||
+ | |||
+ | Nápověda: | ||
+ | |||
+ | ===== Jazyky ===== | ||
+ | |||
+ | K ladění dostanete česká data, abyste měli šanci poznat, zda výstup programu vypadá rozumně. Váš program ale musí fungovat nezávisle na jazyku vstupních dat. Je tedy nežádoucí, | ||
+ | |||
+ | * angličtina | ||
+ | * němčina | ||
+ | * finština | ||
+ | * turečtina | ||
+ | * arabština | ||
+ | |||
+ | {{user: | ||
+ | |||
+ | ===== Další informace ===== | ||
+ | |||
+ | Tento úkol (včetně zadání konkrétního jazyka) si můžete zarezervovat vyplněním formuláře na http:// | ||
+ | |||
+ | Pokud se individuálně nedohodneme jinak, termín odevzdání je konec listopadu. Při některé prosincové přednášce program předvedete ostatním. | ||