[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Morfologická gramatika pro chart parser

Sestavte bezkontextovou gramatiku, která bude popisovat morfologickou skladbu slova v češtině (v případě zájmu se můžeme dohodnout i na jiném jazyku). Gramatiku vytvořte ve formátu kompatibilním s úkolem CHRT (blíže viz v zadání úkolu CHRT).

Podstatnou součástí gramatiky bude slovník českých podstatných jmen, podle potřeby rozdělený ke vzorům (tj. do různých pravidel gramatiky). Slovník nemusí obsahovat všechna česká podstatná jména, ale měl by obsahovat alespoň 100 podstatných jmen, mezi nimiž budou zastoupeny všechny 4 rody (mužský životný, mužský neživotný, ženský a střední) a co nejvíce různých vzorů a podvzorů skloňování (včetně změn kmenových hlásek).

Některá doporučená podstatná jména: pán, hoch, občan, muž, otec, obyvatel, host, kněz, rukojmí, předseda, paňáca, husita, sluha, soudce, patriarcha, hrad, ostrov, zámek, domeček, stroj, den, žena, matka, bába, skica, ruka, růže, píseň, ulice, dveře, město, jablko, středisko, pončo, moře, bojiště, kuře, stavení, génius, virus, kuli, idea, Nikaragua…

Pro každé podstatné jméno, které je ve slovníku, musí gramatika popisovat tvary všech 7 pádů obou čísel. Tam, kde mluvnice připouští více tvarů (páni vs. pánové), by měla gramatika popsat všechny. Naopak gramatika nesmí připustit tvary, které jsou chybné (např. *mužemi). Pro homonymní tvary musí gramatika popsat všechna čtení (např. růže může být 1., 2. nebo 5. pád jednotného čísla a 1., 4. nebo 5. pád množného čísla).

Součástí úkolu je také vytvořit nástroj (v Perlu) pro údržbu slovníku. Uživatel, který se rozhodne přidat do gramatiky nové podstatné jméno, musí mít k dispozici nějakou uživatelsky přítulnou metodu, např. interaktivní program, který mu položí několik málo otázek typu: „V 1. pádě množného čísla je správný tvar páni, pánové, nebo obojí?“ Uživatel může být laik, který neví nic o bezkontextových gramatikách! V úvahu přichází i neinteraktivní volání, kde programu předáte několik tvarů slova a on vám řekne, zda slovo přidal do slovníku a pod jaký vzor (do skupiny jakých slov, jaké jsou zbývající tvary vašeho slova), nebo zda se mu zařazení nepodařilo pro nedostatek informací (a pokud možno určí, jaké tvary by ještě potřeboval znát).

V ideálním případě bude vaše gramatika na závěr otestována ve spojení s existujícím chart parserem, který vytvořili vaši předchůdci v minulých letech. Záleží na tom, jak přesně jste vy i oni splnili zadání, a zda tedy vaše řešení budou vzájemně kompatibilní.


[ Back to the navigation ] [ Back to the content ]