<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="FeedCreator 1.8" -->
<?xml-stylesheet href="https://wiki.ufal.ms.mff.cuni.cz/lib/exe/css.php?s=feed" type="text/css"?>
<rdf:RDF
    xmlns="http://purl.org/rss/1.0/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
    xmlns:dc="http://purl.org/dc/elements/1.1/">
    <channel rdf:about="https://wiki.ufal.ms.mff.cuni.cz/feed.php">
        <title>ufal wiki user:zeman:ukoly</title>
        <description></description>
        <link>https://wiki.ufal.ms.mff.cuni.cz/</link>
        <image rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/lib/tpl/ufal/images/favicon.ico" />
       <dc:date>2026-04-09T15:59:34+00:00</dc:date>
        <items>
            <rdf:Seq>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:automaticke-testovani-zapoctovych-uloh?rev=1235746692&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:brilluv-tagger?rev=1381212823&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:charniakuv-johnsonuv-parser?rev=1193572955&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:chart-parser?rev=1235753730&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:collinsuv-bikeluv-parser?rev=1193572826&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:data?rev=1349444393&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:dobyvani-informaci?rev=1381212782&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:geocaching?rev=1381211970&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hackovani?rev=1381212444&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hmm-tagger?rev=1381212672&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hranice-slov-a-vet?rev=1381212376&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:kontrola-pravopisu?rev=1381212568&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:malt-parser?rev=1381212879&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:minoritni-jazyky?rev=1253791917&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:morfologicka-gramatika-pro-chart-parser?rev=1381212642&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:moses?rev=1381212928&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:mst-parser?rev=1193571850&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:nerizena-morfologicka-analyza?rev=1381212754&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pavouk?rev=1381212242&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pc-kimmo?rev=1381212954&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:podobnost-slov-a-vet?rev=1381212595&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pojmenovane-entity?rev=1381212715&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:rekonstrukce-velkych-pismen?rev=1381212542&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:spolecne?rev=1317798296&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:stanfordsky-parser?rev=1193574835&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:t9?rev=1381212514&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tagger-morce?rev=1254990993&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tagger-tnt?rev=1253808292&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:telugu2latin.pl?rev=1192190323&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tipy?rev=1259429761&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:treetagger?rev=1349298178&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:trideni-jazyku?rev=1381212317&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:vicejazycne-pojmenovane-entity-z-wikipedie?rev=1235929723&amp;do=diff"/>
            </rdf:Seq>
        </items>
    </channel>
    <image rdf:about="https://wiki.ufal.ms.mff.cuni.cz/lib/tpl/ufal/images/favicon.ico">
        <title>ufal wiki</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/</link>
        <url>https://wiki.ufal.ms.mff.cuni.cz/lib/tpl/ufal/images/favicon.ico</url>
    </image>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:automaticke-testovani-zapoctovych-uloh?rev=1235746692&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-02-27T15:58:12+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:automaticke-testovani-zapoctovych-uloh</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:automaticke-testovani-zapoctovych-uloh?rev=1235746692&amp;do=diff</link>
        <description>Automatické testování zápočtových úloh

Tato stránka slouží pro poznámky ohledně testování řešení zápočtových úloh, která mi odevzdají studenti, a způsobů, jak toto testování co nejvíce zautomatizovat. Každý program, který studenti dodají, má trochu jiné volání, volby atd. I když se proti tomu snažím bojovat tím, že v zadání poměrně přesně specifikuju, jak se má program ovládat, pořád si musím vždy znova vzpomínat, jakou specifikaci jsem pro tu kterou úlohu stanovil já sám. Pokud jde navíc o úlo…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:brilluv-tagger?rev=1381212823&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:13:43+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:brilluv-tagger</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:brilluv-tagger?rev=1381212823&amp;do=diff</link>
        <description>Brillův tagger

Stáhněte z internetu (např. z &lt;http://sourceforge.net/projects/gposttl/&gt;) tagger Erika Brilla, nainstalujte ho a rozchoďte ho. Dostanete k dispozici anotovaný korpus, který si rozdělíte na trénovací a testovací data. Natrénujte tagger na trénovacích datech, označkujte testovací data a zjistěte, jaké úspěšnosti tagger dosahuje.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:charniakuv-johnsonuv-parser?rev=1193572955&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-10-28T13:02:35+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:charniakuv-johnsonuv-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:charniakuv-johnsonuv-parser?rev=1193572955&amp;do=diff</link>
        <description>Charniakův parser

Stáhněte z internetu (např. z &lt;http://www.cog.brown.edu/~mj/Software.htm&gt;) parser Eugena Charniaka (volitelně včetně rerankeru Marka Johnsona, ale natrénování rerankeru není jednoduchá záležitost), nainstalujte ho a rozchoďte ho. Dále přiměřeně aplikujte zadání obdobné úlohy pro</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:chart-parser?rev=1235753730&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-02-27T17:55:30+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:chart-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:chart-parser?rev=1235753730&amp;do=diff</link>
        <description>Chart parser



Napište program v Perlu, který načte bezkontextovou gramatiku a řetězec terminálů a vypíše všechny analýzy řetězce podle gramatiky.

Vytvořte si zkušební gramatiku (může modelovat tvarosloví nebo větné vztahy některého přirozeného jazyka), na které parser předvedete v prosinci ostatním.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:collinsuv-bikeluv-parser?rev=1193572826&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-10-28T13:00:26+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:collinsuv-bikeluv-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:collinsuv-bikeluv-parser?rev=1193572826&amp;do=diff</link>
        <description>Collinsův parser

Stáhněte z internetu (např. z &lt;http://people.csail.mit.edu/mcollins/code.html&gt;) parser Michaela Collinse (ať už v původní Collinsově implementaci, nebo v novější verzi od Dana Bikela), nainstalujte ho a rozchoďte ho. Dále přiměřeně aplikujte zadání obdobné úlohy pro</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:data?rev=1349444393&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2012-10-05T15:39:53+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:data</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:data?rev=1349444393&amp;do=diff</link>
        <description>Data k úlohám z počítačového zpracování přirozeného jazyka

(Přístup je chráněn heslem.)

	*  Háčkování: tokenizovaný text s diakritikou
		*  Slovenština
		*  Polština
		*  Maďarština
		*  Řečtina

	*  Hranice slov a vět: tokenizovaný text s vyznačenými hranicemi odstavců a vět
		*  Ruština
		*  Portugalština
		*</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:dobyvani-informaci?rev=1381212782&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:13:02+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:dobyvani-informaci</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:dobyvani-informaci?rev=1381212782&amp;do=diff</link>
        <description>Dobývání informací



Představte si, že provozujete server, který srovnává dostupnost a ceny určitého zboží v různých obchodech na internetu. Informace na vašem serveru je třeba pravidelně aktualizovat, musíte tedy opakovaně navštěvovat jednotlivé internetové obchody a zjišťovat, co momentálně nabízejí a za kolik. Samozřejmě to nechcete opisovat ručně, potřebujete tedy robota, který stránky obchodu proleze a potřebné informace vám zjistí. Bohužel, různé obchody používají odlišný formát stránek. …</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:geocaching?rev=1381211970&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T07:59:30+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:geocaching</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:geocaching?rev=1381211970&amp;do=diff</link>
        <description>Geocaching



Geocaching je hra na hledání pokladů s&amp;nbsp;pomocí navigačních přístrojů GPS. Na internetovém serveru geocaching.com (varování: při řešení tohoto úkolu se pravděpodobně neobejdete bez bezplatné registrace na tomto serveru) jsou zveřejněné souřadnice schránky (tzv. kešky, anglicky cache), uživatel si souřadnice uloží do navigačního přístroje, pak vyrazí do terénu a snaží se schránku najít. Některé kešky jsou tzv.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hackovani?rev=1381212444&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:07:24+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:hackovani</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hackovani?rev=1381212444&amp;do=diff</link>
        <description>Háčkování



Napište program, který doplní do textu chybějící diakritiku. K&amp;nbsp;testování dostanete data v&amp;nbsp;konkrétním jazyku, váš program by však měl být v&amp;nbsp;maximální možné míře jazykově nezávislý. Můžete předpokládat, že jazyk, se kterým program pracuje, píše abecedou na bázi latinky. Vše ostatní, co potřebuje o konkrétním jazyku vědět, by měl být schopen se naučit z</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hmm-tagger?rev=1381212672&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:11:12+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:hmm-tagger</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hmm-tagger?rev=1381212672&amp;do=diff</link>
        <description>Morfologické značkování



Morfologická značka neboli tag je obvykle krátký řetězec písmen, číslic a případně dalších znaků, ve kterém jsou zakódované morfologické a další informace o jednom slovu. Prakticky vždy je ze značky poznat slovní druh, ten bývá v některých případech ještě jemněji rozčleněn (třeba zájmena osobní vs. tázací). Podle potřeby pak značky obsahují informaci o relevantních mluvnických kategoriích, jako jsou rod, číslo, pád, stupeň, osoba, čas aj. I pro jeden jazyk mohou existo…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hranice-slov-a-vet?rev=1381212376&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:06:16+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:hranice-slov-a-vet</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:hranice-slov-a-vet?rev=1381212376&amp;do=diff</link>
        <description>Hranice slov a vět



Napište programy, které najdou v textu hranice slov a vět. K testování dostanete data v konkrétním jazyku, váš program by však měl být v maximální možné míře jazykově nezávislý. Vše, co potřebuje o konkrétním jazyku vědět, by měl být schopen se naučit z dat. (Z toho plyne, že vy daný jazyk ovládat nemusíte.)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:kontrola-pravopisu?rev=1381212568&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:09:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:kontrola-pravopisu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:kontrola-pravopisu?rev=1381212568&amp;do=diff</link>
        <description>Kontrola pravopisu



Kontrola pravopisu (spell checking) obvykle zahrnuje dvě podúlohy:

	*  zjistit, zda je slovo ve slovníku
	*  navrhnout seznam podobných slov, která ve slovníku jsou

Pokud nemáte ručně vytvořený slovník, můžete si vypomoci tím, že se ho naučíte z dostatečně velkého korpusu. Musíte ale pamatovat na to, že korpusy někdy obsahují i překlepy, tedy slova, která ve slovníku mít nechcete. Slova, která navrhujete, by pak měla být seřazená podle pravděpodobnosti, že jsou opravou da…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:malt-parser?rev=1381212879&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:14:39+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:malt-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:malt-parser?rev=1381212879&amp;do=diff</link>
        <description>Malt parser

Stáhněte z internetu (např. z &lt;http://w3.msi.vxu.se/~nivre/research/MaltParser.html&gt;) Malt parser Joakima Nivreho, nainstalujte ho a rozchoďte ho. Dostanete k dispozici anotovaný korpus, který si rozdělíte na trénovací a testovací data. Natrénujte parser na trénovacích datech, rozeberte jím testovací data a zjistěte, jaké úspěšnosti parser dosahuje.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:minoritni-jazyky?rev=1253791917&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-09-24T13:31:57+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:minoritni-jazyky</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:minoritni-jazyky?rev=1253791917&amp;do=diff</link>
        <description>Minoritní jazyky



Toto je variace na úlohu Pavouk, avšak pro jazyky, pro které je i na webu velký nedostatek dat, a proto vyžadují odlišné metody. Jsou to jazyky, pro které tu a tam někdo vyvěsil dokument, obvykle obklopený dokumenty v jiném jazyku, který na daném serveru převažuje. Prostým procházením webu byste se rychle octli v nepřátelském jazykovém prostředí a mohlo by trvat celé měsíce, než náhodou znova narazíte na dokument v hledaném jazyce. Musíte tedy svého robota napsat tak, aby kom…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:morfologicka-gramatika-pro-chart-parser?rev=1381212642&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:10:42+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:morfologicka-gramatika-pro-chart-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:morfologicka-gramatika-pro-chart-parser?rev=1381212642&amp;do=diff</link>
        <description>Morfologická gramatika pro chart parser



Tato úloha má blízký vztah k úloze Chart parser. Parser je program, který s pomocí gramatiky umí rozebírat text a rozpoznávat v něm jednotlivé složky. Text může být slovo, které chceme rozložit na morfémy (morfologická analýza), nebo věta, kterou chceme rozložit na fráze podle větné stavby (syntaktická analýza). Zatímco cílem zmiňované úlohy Chart parser je napsat parser, cílem této úlohy je napsat gramatiku a další obslužné programy, které umožní chart…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:moses?rev=1381212928&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:15:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:moses</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:moses?rev=1381212928&amp;do=diff</link>
        <description>Moses

Moses (Mojžíš) je open-source systém frázového strojového překladu. Přísně vzato, Moses je pouze jedna část překladového systému, i když velmi podstatná: tzv. dekodér. Abyste mohli natrénovat překladový systém a otestovat ho na konkrétních datech, musíte mít k dispozici následující data a nástroje a projít následujícími kroky (zjednodušeno):</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:mst-parser?rev=1193571850&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-10-28T12:44:10+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:mst-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:mst-parser?rev=1193571850&amp;do=diff</link>
        <description>MST parser

Stáhněte z internetu (např. z &lt;http://sourceforge.net/projects/mstparser&gt;) MST (Maximum Spanning Tree) parser Ryana McDonalda, nainstalujte ho a rozchoďte ho. Dále přiměřeně aplikujte zadání obdobné úlohy pro Malt parser.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:nerizena-morfologicka-analyza?rev=1381212754&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:12:34+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:nerizena-morfologicka-analyza</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:nerizena-morfologicka-analyza?rev=1381212754&amp;do=diff</link>
        <description>Segmentace slov na morfémy



Napište program v Perlu, který rozpozná různé tvary stejných slov v textu v libovolném jazyce, aniž by měl k dispozici morfologický slovník. Přesněji: máte každé slovo rozsekat na morfémy. Příkladem morfému je předpona, kmen, přípona. Slovo může mít několik předpon (např.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pavouk?rev=1381212242&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:04:02+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:pavouk</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pavouk?rev=1381212242&amp;do=diff</link>
        <description>Pavouk



Napište program, který dokáže stáhnout z internetu dostatečné množství textů, ze kterých lze vyrobit korpus určitého jazyka. Stáhněte texty v tomto jazyku a vyrobte korpus o alespoň 500000 slov. Součástí zadání bude konkrétní jazyk, váš program by však měl být jazykově nezávislý. Vše, co potřebuje o konkrétním jazyku vědět, by měl být schopen se naučit z dat. (Z toho plyne, že vy daný jazyk ovládat nemusíte, naopak je možná výhodou, když je vám tento jazyk zcela neznámý.)…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pc-kimmo?rev=1381212954&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:15:54+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:pc-kimmo</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pc-kimmo?rev=1381212954&amp;do=diff</link>
        <description>Dvojúrovňová morfologie a PC-Kimmo

Stáhněte z internetu (&lt;http://www.sil.org/pckimmo/&gt;) morfologický analyzátor Evana Antwortha PC-Kimmo (implementuje dvojúrovňovou morfologii podle Kimma Koskenniemiho, 1983), nainstalujte ho a rozchoďte ho.

Vaším úkolem bude vytvořit pro PC-Kimmo slovník s pravidly (soubory .lex, .rul, popř. též .grm) pro jednu z následujících skupin českých slov:</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:podobnost-slov-a-vet?rev=1381212595&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:09:55+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:podobnost-slov-a-vet</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:podobnost-slov-a-vet?rev=1381212595&amp;do=diff</link>
        <description>Podobnost slov a vět



Na vstupu je slovo a slovník, na výstupu je slovník uspořádaný sestupně podle podobnosti se slovem, včetně číselného vyjádření míry podobnosti pro každou položku ve slovníku: 100&amp;nbsp;% = slova jsou totožná, 0</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pojmenovane-entity?rev=1381212715&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:11:55+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:pojmenovane-entity</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:pojmenovane-entity?rev=1381212715&amp;do=diff</link>
        <description>Pojmenované entity



Pojmenované entity (named entities) bývají v počítačovém zpracování přirozeného jazyka definovány různě, ale většinou zahrnují vlastní jména osob, zeměpisné názvy a názvy organizací (včetně zkratek). Mohou být víceslovné.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:rekonstrukce-velkych-pismen?rev=1381212542&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:09:02+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:rekonstrukce-velkych-pismen</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:rekonstrukce-velkych-pismen?rev=1381212542&amp;do=diff</link>
        <description>Rekonstrukce velkých písmen



Napište program, který načte text psaný převážně nebo zcela malými písmeny a nahradí malá písmena velkými tam, kde správně mají být.

Motivace: Při trénování statistického strojového překladu se trénovací data převádějí na malá písmena. Dělá se to proto, aby se zbytečně neštěpily statistiky. Příklad: české slovo</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:spolecne?rev=1317798296&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2011-10-05T09:04:56+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:spolecne</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:spolecne?rev=1317798296&amp;do=diff</link>
        <description>(úloha z počítačového zpracování přirozeného jazyka)

Upozornění: Specifikace je detailnější (a tudíž více svazující) než bývá u zápočtových úloh zvykem. Ideálně by díky tomu měla tři řešení téže úlohy od tří různých lidí být zaměnitelná; šetří vám to také práci s dokumentací, která už je součástí zadání. Samozřejmě nelze vyloučit, že najdete dobrý důvod, aby něco bylo jinak než ve specifikaci; takové případy se mnou prosím</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:stanfordsky-parser?rev=1193574835&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-10-28T13:33:55+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:stanfordsky-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:stanfordsky-parser?rev=1193574835&amp;do=diff</link>
        <description>Stanfordský parser

Stáhněte z internetu (např. z &lt;http://nlp.stanford.edu/software/lex-parser.shtml&gt;) Stanfordský parser (Chris Manning a spol.), nainstalujte ho a rozchoďte ho. Dále přiměřeně aplikujte zadání obdobné úlohy pro Malt parser.

Stanfordský parser umí jak závislostní, tak složkové stromy, přesto ale budete muset zapracovat na převodu dat z formátu</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:t9?rev=1381212514&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:08:34+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:t9</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:t9?rev=1381212514&amp;do=diff</link>
        <description>T9



T9 je zkratka pro text na 9 klávesách a jde o technologii určenou pro vkládání textu na mobilních telefonech. Každá klávesa může odpovídat několika různým písmenům, pro různé jazyky různým, následující příklad je pro češtinu:</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tagger-morce?rev=1254990993&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-10-08T10:36:33+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:tagger-morce</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tagger-morce?rev=1254990993&amp;do=diff</link>
        <description>Morče

Autory tohoto taggeru jsou studenti MFF UK, momentálně ho spravuje Jan Raab. Stránku o taggeru najdete na &lt;http://ufal.mff.cuni.cz/morce/&gt;.

Stáhněte Morče, rozchoďte ho a přečtěte si zadání pro Brillův tagger, které přiměřeně aplikujte na Morče.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tagger-tnt?rev=1253808292&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-09-24T18:04:52+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:tagger-tnt</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tagger-tnt?rev=1253808292&amp;do=diff</link>
        <description>Tagger TnT

Autorem tohoto taggeru je Thorsten Brants z univerzity v Saarbrückenu (nyní u Googlu). Stránku o taggeru najdete na &lt;http://www.coli.uni-saarland.de/~thorsten/tnt/&gt;. U tohoto taggeru je nutné nejdříve vyplnit licenční ujednání a odfaxovat ho Thorstenovi do USA; licence je bezplatná.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:telugu2latin.pl?rev=1192190323&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-10-12T13:58:43+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:telugu2latin.pl</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:telugu2latin.pl?rev=1192190323&amp;do=diff</link>
        <description>telugu2latin.pl

#!/usr/bin/perl
# Převede text z telužského písma do latinky. Jde pouze o usnadnění čitelnosti, ne nutně o zachování veškeré informace.
# (c) 2007 Dan Zeman &lt;zeman@ufal.mff.cuni.cz&gt;
# Licence: GNU GPL

use utf8;
use open &quot;:utf8&quot;;
binmode(STDIN, &quot;:utf8&quot;);
binmode(STDOUT, &quot;:utf8&quot;);
binmode(STDERR, &quot;:utf8&quot;);

# Samostatná písmena pro samohlásky začínají kódem 3077.
@samohlasky = (&quot;a&quot;, &quot;á&quot;, &quot;i&quot;, &quot;í&quot;, &quot;u&quot;, &quot;ú&quot;, &quot;r&quot;, &quot;l&quot;, &quot;&quot;, &quot;e&quot;, &quot;é&quot;, &quot;aj&quot;, &quot;&quot;, &quot;o&quot;, &quot;ó&quot;, &quot;au&quot;);
for(my $i = 0; $i&lt;=$#s…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tipy?rev=1259429761&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-11-28T18:36:01+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:tipy</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:tipy?rev=1259429761&amp;do=diff</link>
        <description>Varování

Toto jsou Danovy tipy na případné další úlohy z PZPJ. Tato stránka není tajná, tudíž není chráněná heslem, ale pokud nejste já, tak vám bude k ničemu, protože úlohy zde uvedené letos pravděpodobně nejsou a ani nebudou vypsány.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:treetagger?rev=1349298178&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2012-10-03T23:02:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:treetagger</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:treetagger?rev=1349298178&amp;do=diff</link>
        <description>TreeTagger

Tento tagger pracuje na principu tzv. rozhodovacích stromů a jeho autorem je Helmut Schmid z&amp;nbsp;univerzity ve Stuttgartu. Stránku o taggeru najdete na &lt;http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/&gt;.

Stáhněte TreeTagger, rozchoďte ho a přečtěte si zadání pro Brillův tagger, které přiměřeně aplikujte na TreeTagger.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:trideni-jazyku?rev=1381212317&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T08:05:17+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:trideni-jazyku</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:trideni-jazyku?rev=1381212317&amp;do=diff</link>
        <description>Rozpoznávání a třídění jazyků



Napište program, který dokáže rozpoznat jazyk dokumentu, věty a slova a roztřídit vstupní text podle jazyků. Součástí zadání bude konkrétní skupina jazyků, které má program umět poznat, váš program by však měl být jazykově nezávislý. Vše, co potřebuje o konkrétních jazycích vědět, by měl být schopen se naučit z dat. (Z toho plyne, že vy dané jazyky ovládat nemusíte, naopak je možná výhodou, když jsou vám zcela neznámé.)…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:vicejazycne-pojmenovane-entity-z-wikipedie?rev=1235929723&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-03-01T18:48:43+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly:vicejazycne-pojmenovane-entity-z-wikipedie</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly:vicejazycne-pojmenovane-entity-z-wikipedie?rev=1235929723&amp;do=diff</link>
        <description>Vícejazyčné pojmenované entity z Wikipedie

Toto zatím není plnohodnotné zadání zápočtové úlohy, ale jen nápad, který je potřeba dotvořit. V&amp;nbsp;případě zájmu kontaktujte Dana Zemana se svojí představou, jak by váš program měl vypadat.</description>
    </item>
</rdf:RDF>
