This is an old revision of the document!
Table of Contents
Dvojúrovňová morfologie a PC-Kimmo
Stáhněte z internetu (http://www.sil.org/pckimmo/) morfologický analyzátor Evana Antwortha PC-Kimmo (implementuje dvojúrovňovou morfologii podle Kimma Koskenniemiho, 1983), nainstalujte ho a rozchoďte ho.
Vaším úkolem bude vytvořit pro PC-Kimmo slovník s pravidly (soubory .lex, .rul, popř. též .grm) pro jednu z následujících skupin českých slov:
- Podstatná jména
- Přídavná jména a příslovce, včetně odvozování mezi nimi
- Slovesa
Dostanete k dispozici data z PDT, odkud můžete vytáhnout seznam českých slov daného druhu. Pravidla tvarosloví zjistěte v mluvnici (např. Petr Karlík et al.: Příruční mluvnice češtiny. Nakladatelství Lidové noviny, Praha, 1996.)
Výsledky své práce budete prezentovat ostatním na některé prosincové přednášce.
Poznámky k architektuře
PC-Kimmo je napsáno v C. Kromě zdrojáků pro Unix je k dispozici i přeložený program pro DOS/Windows. Obsahuje vzorový slovník angličtiny.
Data
Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http://ufal.mff.cuni.cz/corp-lic/pdt20-reg.html; do kolonky Optional information vyplňte “PFL007”. O registraci bych se měl dozvědět a poslat vám odkaz na data.
Další informace
Tento úkol (včetně zadání konkrétního jazyka) si můžete zarezervovat vyplněním formuláře na http://ufal.mff.cuni.cz/cgi-bin/zeman/zapoctaky/rezervace_ukolu.pl (pokud ještě není rozebrán).
Termín odevzdání e-mailem je konec listopadu, prezentace programu proběhne v prosinci.