[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Dvojúrovňová morfologie a PC-Kimmo

Stáhněte z internetu (http://www.sil.org/pckimmo/) morfologický analyzátor Evana Antwortha PC-Kimmo (implementuje dvojúrovňovou morfologii podle Kimma Koskenniemiho, 1983), nainstalujte ho a rozchoďte ho.

Vaším úkolem bude vytvořit pro PC-Kimmo slovník s pravidly (soubory .lex, .rul, popř. též .grm) pro jednu z následujících skupin českých slov:

Dostanete k dispozici data z PDT, odkud můžete vytáhnout seznam českých slov daného druhu. Pravidla tvarosloví zjistěte v mluvnici (např. Petr Karlík et al.: Příruční mluvnice češtiny. Nakladatelství Lidové noviny, Praha, 1996.)

Výsledky své práce budete prezentovat ostatním na některé prosincové přednášce.

Poznámky k architektuře

PC-Kimmo je napsáno v C. Kromě zdrojáků pro Unix je k dispozici i přeložený program pro DOS/Windows. Obsahuje vzorový slovník angličtiny.

Data

Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http://ufal.mff.cuni.cz/corp-lic/pdt20-reg.html; do kolonky Optional information vyplňte “PFL007”. O registraci bych se měl dozvědět a poslat vám odkaz na data.

Další informace

Tento úkol (včetně zadání konkrétního jazyka) si můžete zarezervovat vyplněním formuláře na http://ufal.mff.cuni.cz/cgi-bin/zeman/zapoctaky/rezervace_ukolu.pl (pokud ještě není rozebrán).

Termín odevzdání e-mailem je konec listopadu, prezentace programu proběhne v prosinci.


[ Back to the navigation ] [ Back to the content ]