<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="FeedCreator 1.8" -->
<?xml-stylesheet href="https://wiki.ufal.ms.mff.cuni.cz/lib/exe/css.php?s=feed" type="text/css"?>
<rdf:RDF
    xmlns="http://purl.org/rss/1.0/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
    xmlns:dc="http://purl.org/dc/elements/1.1/">
    <channel rdf:about="https://wiki.ufal.ms.mff.cuni.cz/feed.php">
        <title>ufal wiki user:zeman</title>
        <description></description>
        <link>https://wiki.ufal.ms.mff.cuni.cz/</link>
        <image rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/lib/tpl/ufal/images/favicon.ico" />
       <dc:date>2026-04-20T20:31:01+00:00</dc:date>
        <items>
            <rdf:Seq>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:acquis?rev=1215616144&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:addicter?rev=1340381138&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:brilluv-tagger?rev=1194767866&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:conll-dependency-treebanks?rev=1215615363&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:constituents-versus-dependencies?rev=1215615090&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:danish-dependency-treebank?rev=1215615505&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:deltacorpus?rev=1467269172&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:displaying-giza-alignments-in-tred?rev=1192277333&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:dz-parser?rev=1179498276&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:eman?rev=1358951981&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:git?rev=1484745263&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:giza?rev=1244047739&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:hamledt?rev=1407139515&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:handly-v-perlu?rev=1268931553&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:intersecting-parallel-corpora?rev=1366716326&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:interset?rev=1484567877&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:joshua?rev=1283262909&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:lib?rev=1265964225&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:malt-parser?rev=1373573725&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:mdmake?rev=1682093862&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:mojave?rev=1358931146&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morfologicka-analyza-hindstiny?rev=1290500953&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morpho-challenge-2007?rev=1180458051&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morpho-challenge-2008?rev=1217848065&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:moses-na-questu?rev=1391769004&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:moses?rev=1258376447&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:north-american-news-text-corpus?rev=1215613994&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parser-adaptation?rev=1215616348&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parsing-evaluation?rev=1215614539&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parsing?rev=1215614800&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:pc-kimmo?rev=1257926285&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:penn-treebank?rev=1215613700&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-svn-trac-na-git-redmine?rev=1358848738&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-tcsh-na-bash?rev=1244667065&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-windows-na-ubuntu?rev=1316774280&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:preklad-morfemu?rev=1332192749&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:priprava-paralelniho-korpusu?rev=1244047951&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:rizeni-pokusu-pomoci-makefilu?rev=1682085438&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:self-training?rev=1215614595&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:semantic-dependency-parsing?rev=1406974526&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:srilm?rev=1243938857&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:start?rev=1684244200&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:stopwords?rev=1383857592&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tahak-o-promennych-v-makefilech?rev=1255355874&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tahak?rev=1258103586&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:talbanken05?rev=1216816174&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tectomt?rev=1268817705&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tisk-na-ufalu?rev=1505933513&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:transliteration-of-urdu-to-latin-script?rev=1289892321&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tred?rev=1689582695&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:treebank-engineering?rev=1309514931&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:treebanks?rev=1405611809&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tsd2010?rev=1283958178&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:turecka-morfologie?rev=1371718906&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tutorial-pro-moses-na-mt-marathon-v-praze-v-lednu-2009-vedeny-joshem-schroederem?rev=1260956864&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly?rev=1381208153&amp;do=diff"/>
                <rdf:li rdf:resource="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:wmt?rev=1370969217&amp;do=diff"/>
            </rdf:Seq>
        </items>
    </channel>
    <image rdf:about="https://wiki.ufal.ms.mff.cuni.cz/lib/tpl/ufal/images/favicon.ico">
        <title>ufal wiki</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/</link>
        <url>https://wiki.ufal.ms.mff.cuni.cz/lib/tpl/ufal/images/favicon.ico</url>
    </image>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:acquis?rev=1215616144&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T17:09:04+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:acquis</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:acquis?rev=1215616144&amp;do=diff</link>
        <description>[ name = Acquis
| path = /fs/clip-corpora/Europarl/acquis
| owner = zeman
]

The JRC-Acquis corpus is a large collection of European Union documents in 21 languages: Czech, Danish, Dutch, German, Greek, English, Estonian, Finnish, French, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish, Swedish. Its original format is TEI-compliant XML. It is a parallel corpus and automatic paragraph-level alignment is available (sentence boundaries are no…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:addicter?rev=1340381138&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2012-06-22T18:05:38+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:addicter</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:addicter?rev=1340381138&amp;do=diff</link>
        <description>Addicter

Addicter stands for Automatic Detection and DIsplay of Common Translation ERrors. It will be a set of tools (mostly scripts written in Perl) that help with error analysis for machine translation.

The work on Addicter has started at the MT Marathon 2010 in Dublin, within a broader 5-day project called Failfinder (Dan Zeman, Ondřej Bojar, Martin Popel, David Mareček, Jon Clark, Ken Heafield, Qin Gao, Loïc Barrault). The code that resulted from the project can be freely downloaded from…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:brilluv-tagger?rev=1194767866&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-11-11T08:57:46+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:brilluv-tagger</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:brilluv-tagger?rev=1194767866&amp;do=diff</link>
        <description>Brillův tagger

setenv BRILL /home/zeman/nastroje/taggery/brill/RULE_BASED_TAGGER_V1.14

Potřebujeme trénovací korpus. Ten musí být tokenizovaný, každá věta na samostatném řádku. Každý token má tvar slovo/značka. Zatím nevím, jak se zachází s lomítkem jako slovem.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:conll-dependency-treebanks?rev=1215615363&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:56:03+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:conll-dependency-treebanks</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:conll-dependency-treebanks?rev=1215615363&amp;do=diff</link>
        <description>[ name = CoNLL Dependency Treebanks
| owner = zeman
| path = /fs/clip-corpora/conll
| version = 2006
]

CoNLL-X Shared Task involved dependency parsing of the following languages:

	*  Arabic (Prague Arabic Dependency Treebank)
	*  Bulgarian (BulTreeBank)
	*  Chinese (Sinica Treebank)
	*  Czech (Prague Dependency Treebank)
	*  Danish (Danish Dependency Treebank)
	*  Dutch (Alpino Treebank)
	*  German (Tiger)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:constituents-versus-dependencies?rev=1215615090&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:51:30+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:constituents-versus-dependencies</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:constituents-versus-dependencies?rev=1215615090&amp;do=diff</link>
        <description>How to convert constituents to dependencies

Generally, you need a table that says for each rule, which of the right-hand-side constituents is the head of the phrase. Then you can say which terminal symbol (leaf) is the lexical head of the phrase (find head of the head phrase recursively until you arrive at a leaf). Finally, if word w1 is the lexical head of phrase P1, word w2 is the lexical head of phrase P2, P1 is the head of phrase P</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:danish-dependency-treebank?rev=1215615505&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:58:25+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:danish-dependency-treebank</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:danish-dependency-treebank?rev=1215615505&amp;do=diff</link>
        <description>[ name = Danish Dependency Treebank
| owner = zeman
| path = /fs/clip-corpora/conll/danish
| version = 2006
]

We have the Danish Dependency Treebank that has been used in the CoNLL-06 shared task. There are 5,190 training sentences, 94,386 training words, 322 test sentences, and 5,852 test words.

A few transformations have been applied to the treebank in order to make it more similar to the design of other treebanks. For instance, possessive pronouns should depend on the possessed noun, while …</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:deltacorpus?rev=1467269172&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2016-06-30T08:46:12+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:deltacorpus</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:deltacorpus?rev=1467269172&amp;do=diff</link>
        <description>Deltacorpus

Delexicalized tagging and parsing.

&lt;https://github.com/ufal/deltacorpus&gt;

Cesty na disku:

	*  /home/zhiwai/pos ... zde zůstal Zhiweiův kód
	*  /home/marecek/listr/delex_pos ... zde to dále rozvíjí David
		*  /home/marecek/listr/ud_delex_pos ... vylepšené makefily a data z Universal Dependencies 1.2</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:displaying-giza-alignments-in-tred?rev=1192277333&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-10-13T14:08:53+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:displaying-giza-alignments-in-tred</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:displaying-giza-alignments-in-tred?rev=1192277333&amp;do=diff</link>
        <description>Displaying Giza Alignments in Tred

Note: Tred is a dependency-tree editor. It was not designed to work with bilingual alignment. However, since Tred is highly customizable, displaying anything where one needs to connect words (nodes) can in theory be accomplished with Tred. (And note the emphasis on displaying, as opposed to editing.)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:dz-parser?rev=1179498276&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-05-18T16:24:36+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:dz-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:dz-parser?rev=1179498276&amp;do=diff</link>
        <description>DZ Parser

DZ Parser má svoji stránku na adrese &lt;http://ufal.mff.cuni.cz/~zeman/projekty/parser/index.html&gt;. To, co je zde, jsou pracovní poznámky.

svn checkout file:///net/work/public/SVN/dzparser/trunk dzparser

Následující části byly vyčleněny do samostatných stránek. Viz též obsah této stránky vpravo nahoře.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:eman?rev=1358951981&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-01-23T15:39:41+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:eman</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:eman?rev=1358951981&amp;do=diff</link>
        <description>Eman

Instalace

git clone https://daniel.zeman@redmine.ms.mff.cuni.cz/eman.git eman
git clone https://daniel.zeman@redmine.ms.mff.cuni.cz/ufal-smt-playground.git statmt
export PATH=$PATH:`pwd`/eman/bin
cd statmt/playground

Mělo by to jít vybalit i bez toho uživatelského jména (</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:git?rev=1484745263&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2017-01-18T14:14:23+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:git</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:git?rev=1484745263&amp;do=diff</link>
        <description>Redmine a Git

Poznámky o migraci ze Subversion na Git mám např. v souboru /net/work/people/zeman/hamledt/README.txt (resp. v repozitáři HamleDT, který jsem také stěhoval ze Subversion na Github). Tam je navíc oproti postupu popsanému zde popsáno ještě použití čističe historie BFG (</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:giza?rev=1244047739&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-06-03T18:48:59+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:giza</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:giza?rev=1244047739&amp;do=diff</link>
        <description>Giza++

Giza++ je nástroj pro slovní párování (alignment) paralelních textů. Autorem je Franz Och a další. Tahle stránka uchovává poznámky o instalaci a pouštění Gizy na ÚFALu. Je primárně založena na tutoriálu pro Moses z MT Marathonu 2009. Spolu s Gizou potřebujeme ještě program</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:hamledt?rev=1407139515&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2014-08-04T10:05:15+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:hamledt</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:hamledt?rev=1407139515&amp;do=diff</link>
        <description>HamleDT 2.0 TO DO

22.4.2014: DZ: Prošel jsem všech 30 jazyků a dal jsem jejich pražskou normalizaci alespoň částečně do pořádku. Částečně znamená, že jsem vynuloval testy na AfunNotNR, FinalPunctuation a vše kolem nekonzistentních koordinací. Samozřejmě by to chtělo dál pracovat na Auxech, interpunkci a zbytečných neprojektivitách, ale to už se v této verzi nedá zvládnout. Máme tu další související úkoly a přinejmenším některé z nich mají podle mě teď vyšší prioritu:…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:handly-v-perlu?rev=1268931553&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2010-03-18T17:59:13+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:handly-v-perlu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:handly-v-perlu?rev=1268931553&amp;do=diff</link>
        <description>Handle souboru v Perlu

Handle souboru nemá ustálený český překlad. Někdy se používá “deskriptor souboru”, což není úplně totéž a není to o nic češtější. Má se tím na mysli identifikátor, kterým v&amp;nbsp;programu odkazujeme na již otevřený soubor, resp. vstupní nebo výstupní proud (nemusí jít nutně o pojmenovaný soubor na disku). V</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:intersecting-parallel-corpora?rev=1366716326&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-04-23T13:25:26+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:intersecting-parallel-corpora</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:intersecting-parallel-corpora?rev=1366716326&amp;do=diff</link>
        <description>Intersecting Parallel Corpora

The organizers of the annual Workshop on Machine Translation (WMT) prepare and distribute parallel corpora that can be used to train systems for the shared tasks. Two core types of corpora are the News Commentary corpus and the Europarl corpus. Both are available in several language pairs, always between English and another European language: cs-en, de-en, es-en and fr-en. The corpora are not multi-parallel. They come from the same source and there is significant o…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:interset?rev=1484567877&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2017-01-16T12:57:57+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:interset</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:interset?rev=1484567877&amp;do=diff</link>
        <description>Interset is a means of converting among various tag sets in natural language processing. The core idea is similar to interlingua-based machine translation. Interset defines a set of features that are encoded by the various tag sets. The set of features should be as universal as possible. It does not need to encode everything that is encoded by any tag set but it should encode all information that people may want to access and/or port from one tag set to another. (The features and their values ar…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:joshua?rev=1283262909&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2010-08-31T15:55:09+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:joshua</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:joshua?rev=1283262909&amp;do=diff</link>
        <description>Joshua

Toto jsou Danovy poznámky k práci s hierarchickým překladovým dekodérem Joshuou (reimplementace Hiera (David Chiang) v Javě od lidí z JHU (Zhifei Li)).

Zdroje informací:

	*  Soubory INSTALL a README přímo v balíčku s Joshuou.
	*</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:lib?rev=1265964225&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2010-02-12T09:43:45+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:lib</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:lib?rev=1265964225&amp;do=diff</link>
        <description>Danovy perlové knihovny

Jsou dostupné na úfalí síti v&amp;nbsp;/home/zeman/lib, některé (Interset) i jinde. Příležitostně je distribuuju, když někomu dávám nějaký svůj program, který je využívá. Pokud někdy nebudu mít do čeho píchnout, možná sem připíšu i jejich seznam a stručný popis.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:malt-parser?rev=1373573725&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-07-11T22:15:25+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:malt-parser</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:malt-parser?rev=1373573725&amp;do=diff</link>
        <description>Malt parser: pokusy s PDT 2.0

&lt;http://maltparser.org/&gt;

Od května 2012 používám Malt Parser 1.7.1 z&amp;nbsp;/home/zeman/nastroje/parsery/maltparser-1.7.1.

Podle Joakima trénování na celém PDT trvá 3 až 5 dní, a to ještě jen při použití splitting tricku (bez něj několik týdnů). Trénování SVM má kvadratickou složitost vzhledem k</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:mdmake?rev=1682093862&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-04-21T18:17:42+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:mdmake</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:mdmake?rev=1682093862&amp;do=diff</link>
        <description>mdmake

&lt;https://github.com/dan-zeman/mdmake&gt;

Imagine you need to apply the same sequence of tools to a set of data files, and possibly want to be able to repeat the experiment later, i.e. sometime in future you will want recall how precisely the processing would be invoked. One example is a shared task in processing of similarly formatted data in many languages. One may want to use</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:mojave?rev=1358931146&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-01-23T09:52:26+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:mojave</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:mojave?rev=1358931146&amp;do=diff</link>
        <description>Návrh projektu na MT Marathon Dublin 2010

Ondřej objevil formulář, kde je potřeba návrh projektu zaregistrovat do půlnoci 10.1.2010: &lt;http://www.mtmarathon2010.info/web/Projects.html&gt;

Nástroj pro automatické vyhledávání určitých typů chyb strojového překladu a jejich pohodlné zobrazení. Měl by být užitečný zejména pro lidi, kteří neovládají jeden z jazyků, mezi kterými se překládá. Vyhledávání a vizualizace ale bude užitečná pro všechny. Primárně předpokládáme testování s Mosesem a Joshuou, al…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morfologicka-analyza-hindstiny?rev=1290500953&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2010-11-23T09:29:13+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:morfologicka-analyza-hindstiny</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morfologicka-analyza-hindstiny?rev=1290500953&amp;do=diff</link>
        <description>Morfologická analýza hindštiny

Evidentně existuje vícero nástrojů, ale dlouho bylo těžké se k&amp;nbsp;nim dostat a rozchodit je. Hajdarábádský analyzátor (anusAraka), který se nám v&amp;nbsp;létě 2009 nepodařilo rozchodit ani za přímé asistence jeho hajdarábádského správce Avinéše PVS, nakonec doznal změn a objevil se na jejich webu ke stažení pod licencí GNU</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morpho-challenge-2007?rev=1180458051&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2007-05-29T19:00:51+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:morpho-challenge-2007</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morpho-challenge-2007?rev=1180458051&amp;do=diff</link>
        <description>Morpho Challenge 2007

Stránky soutěže jsou na &lt;http://www.cis.hut.fi/morphochallenge2007/&gt;. E-mailová adresa organizátorů je &lt;morphochallenge2007@james.hut.fi&gt;.

Data mám v ~/data/morphochallenge.

Dostali jsme pro každý jazyk (angličtinu, němčinu, finštinu a turečtinu) seznam slovních tvarů a jejich četností. Měli jsme za úkol pro každý slovní tvar vrátit jeho dělení na morfémy. Morfémy mohly být identifikovány libovolným řetězcem, při vyhodnocování se pouze zjišťovalo, zda se u slov, která ma…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morpho-challenge-2008?rev=1217848065&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-08-04T13:07:45+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:morpho-challenge-2008</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:morpho-challenge-2008?rev=1217848065&amp;do=diff</link>
        <description>Morpho Challenge 2008

Stránky soutěže jsou na &lt;http://www.cis.hut.fi/morphochallenge2008/&gt;. E-mailová adresa organizátorů je &lt;morphochallenge2007@james.hut.fi&gt;. Poznámky k mému loňskému řešení jsou na stránce Morpho Challenge 2007.

Data mám v ~/data/morphochallenge/2008. Programy mám v ~/projekty/morphochallenge (odkaz na data vede i odsud). Původně byly v</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:moses-na-questu?rev=1391769004&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2014-02-07T11:30:04+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:moses-na-questu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:moses-na-questu?rev=1391769004&amp;do=diff</link>
        <description>Moses na questu

Toto jsou moje poznámky, jak obalit Mosese a Emana webovou aplikací. Varování ministra informatiky: Cílem tohoto postupu není udělat to správně. Cílem je co nejrychleji a s co nejmenším úsilím rozchodit alespoň něco. Je tam proto řada velmi brutálních hacků. Až bude více času, nahradíme je lepším řešením. Zcela se zde ignoruje MT Monkey (určen přímo pro poskytování překladu jako webové služby) a minicluster, na který by se takovéto úlohy měly z questu odesílat.…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:moses?rev=1258376447&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-11-16T14:00:47+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:moses</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:moses?rev=1258376447&amp;do=diff</link>
        <description>Ondrův návod, jak pouštět Mosese

Instalace

Ptica: pozor, toto je navod na stary moses_playground, novy lezi na &lt;https://svn.ms.mff.cuni.cz/projects/statmt/&gt;

svn co https://svn.ms.mff.cuni.cz/svn/treedecode/moses_playground

Poznámka Dan: mám to v /net/work/people/zeman/moses.

# stahni si srilm, treba takto:
cd moses_playground/src
ln -s /a/merkur1/bojar/moses_wmt09/src/srilm.tgz ./</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:north-american-news-text-corpus?rev=1215613994&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:33:14+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:north-american-news-text-corpus</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:north-american-news-text-corpus?rev=1215613994&amp;do=diff</link>
        <description>[ name = North American News Text Corpus
| path = /fs/clip-corpora/north_american_news
| owner = zeman
]

The North American News Text Corpus (NANTC) is a large collection of English newswire text, published by the Linguistic Data Consortium (Graff, 1995; LDC95T21). Our copy resides in

/fs/clip-corpora/north_american_news

Note: In the following text,</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parser-adaptation?rev=1215616348&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T17:12:28+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:parser-adaptation</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parser-adaptation?rev=1215616348&amp;do=diff</link>
        <description>Parser Adaptation

Mnoho starších poznámek mám ve Wordu.

Yet older notes exist at UMIACS NLP Wiki.

setenv PADAPT /net/work/people/zeman/padapt
cd $PADAPT

This thing is not (yet) under version control.

There is a Makefile in $PADAPT. make all should take care of all numbers in all experiments. However, some of the procedures (especially reranker training) are better run separately on the LRC cluster.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parsing-evaluation?rev=1215614539&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:42:19+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:parsing-evaluation</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parsing-evaluation?rev=1215614539&amp;do=diff</link>
        <description>To evaluate the parsing results (constituents, not dependencies!) by comparing them against a treebank, the standard program is evalb. This program by Satoshi Sekine and Michael Collins is now part of our parsing repository and can be found in $PARSINGROOT/evalb</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parsing?rev=1215614800&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:46:40+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:parsing</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:parsing?rev=1215614800&amp;do=diff</link>
        <description>This is a hub for parsing tools, data, and experiments done within the MT group of CLIP UMIACS.

Tools

	*  Parsers
	*  Parsing Evaluation
	*  Constituents versus Dependencies

Data

	*  Treebanks
		*  Penn Treebank (English)
		*  CoNLL Dependency Treebanks (various languages)
			*  Danish Dependency Treebank
			*  Talbanken05 (Swedish)


	*  Raw text
		*  North American News Text Corpus (English)
		*  Acquis (21 European languages)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:pc-kimmo?rev=1257926285&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-11-11T08:58:05+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:pc-kimmo</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:pc-kimmo?rev=1257926285&amp;do=diff</link>
        <description>PC Kimmo

Jak naplnit slovník PC Kimma? Předpokládejme, že už máme popsaná fonologická pravidla jazyka a máme navrženou základní strukturu podslovníků. Ve slovníku už jsou všechny základní vzory ohýbání slov. Jak nyní naplnit slovník z</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:penn-treebank?rev=1215613700&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:28:20+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:penn-treebank</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:penn-treebank?rev=1215613700&amp;do=diff</link>
        <description>[ name = Penn Treebank
| version = 14 Feb 2001
| path = /fs/clip2/Corpora/Treebank-3
| owner = hwa
]

The Penn Treebank has become a standard data set for training and testing English parsers. There are constituent analyses of texts from various sources but the most widely used part is data from the Wall Street Journal. People usually train on sections 02-21, do various development tests and tunes on sections 00, 01, 22, and 24, and final evaluation on section 23.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-svn-trac-na-git-redmine?rev=1358848738&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-01-22T10:58:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:prechod-z-svn-trac-na-git-redmine</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-svn-trac-na-git-redmine?rev=1358848738&amp;do=diff</link>
        <description>Přechod na nové úložiště Redmine/git

ÚFALí server Redmine je na adrese &lt;https://redmine.ms.mff.cuni.cz/projects&gt;. Ondra na něj v&amp;nbsp;říjnu 2012 přestěhoval podstatnou část repozitáře StatMT z&amp;nbsp;svn/trac (&lt;https://svn.ms.mff.cuni.cz/trac/statmt&gt;). Konkrétně jsou tu teď projekty ufal-smt-playground a eman (na něj se z&amp;nbsp;playgroundu odkazuje jako na podmodul).</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-tcsh-na-bash?rev=1244667065&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-06-10T22:51:05+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:prechod-z-tcsh-na-bash</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-tcsh-na-bash?rev=1244667065&amp;do=diff</link>
        <description>Přechod z tcsh na bash

Odkazy

 * &lt;http://en.wikipedia.org/wiki/Comparison_of_computer_shells&gt;

Syntaxe

Na co dát pozor při psaní skriptů:

Proměnné

tcsh:

setenv VARIABLE value

bash:

export VARIABLE=value

Přesměrování výstupu

tcsh:

( command &gt; x.out ) &gt;&amp; x.err

bash:

command &gt; x.out 2&gt; x.err</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-windows-na-ubuntu?rev=1316774280&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2011-09-23T12:38:00+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:prechod-z-windows-na-ubuntu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:prechod-z-windows-na-ubuntu?rev=1316774280&amp;do=diff</link>
        <description>Tohle poběží možná ve Wine, nejspíš vůbec:

	*  GSAK
	*  Garmin MapSource
	*  ovladač Garmin GPS USB
	*  GPicSync
	*  Ozi Explorer
	*  Sony Ericsson PC Companion (přenos souborů a použití mobilu jako modemu pro notebook)
	*  Lingea Lexicon</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:preklad-morfemu?rev=1332192749&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2012-03-19T22:32:29+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:preklad-morfemu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:preklad-morfemu?rev=1332192749&amp;do=diff</link>
        <description>Překlad morfémů

Zbývá udělat

	*  Rozebrat Morfessorem všechna anglická a česká trénovací, vývojová i testovací data.
		*  Vybrat vhodný malý pokus s malými daty, na kterých se to provede.
		*  Pozor! Pokud pustím Morfessora na malých datech, bude dávat horší výsledky, než když ho pustím na velkých!</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:priprava-paralelniho-korpusu?rev=1244047951&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-06-03T18:52:31+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:priprava-paralelniho-korpusu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:priprava-paralelniho-korpusu?rev=1244047951&amp;do=diff</link>
        <description>Příprava paralelního korpusu

Toto je přehled některých kroků, které bývá potřeba udělat s paralelním korpusem, než ho předhodíme Mosesovi, Joshuovi či jinému překladači.

Typicky potřebujeme

	*  Jednojazyčná trénovací data pro jazykový model cílového jazyka (bývají obrovská)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:rizeni-pokusu-pomoci-makefilu?rev=1682085438&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-04-21T15:57:18+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:rizeni-pokusu-pomoci-makefilu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:rizeni-pokusu-pomoci-makefilu?rev=1682085438&amp;do=diff</link>
        <description>Řízení pokusů pomocí Makefilů

Danova úvodní poznámka: V&amp;nbsp;poslední době se mi několikrát stalo, že jsem potřeboval aplikovat stejnou řadu skriptů za několik různých datových souborů, případně stejný pokus zopakovat po delší době, takže bylo pracné si vzpomenout, jak přesně jsem co volal. Konkrétně šlo o vícejazyčné soutěže ve zpracování přirozených jazyků (</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:self-training?rev=1215614595&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-09T16:43:15+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:self-training</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:self-training?rev=1215614595&amp;do=diff</link>
        <description>This page describes an experiment conducted by Dan Zeman in November and December 2006.

I am trying to repeat the experiment of David McClosky, Eugene Charniak, and Mark Johnson (NAACL 2006, New York) with self-training a parser. The idea is that you train a parser on small data, run it over big data, re-train it on its own output for the big data, and have a better-performing parser. The folks at Brown University used Charniak's reranking parser, i.e. a parser-reranker sequence. The big data w…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:semantic-dependency-parsing?rev=1406974526&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2014-08-02T12:15:26+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:semantic-dependency-parsing</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:semantic-dependency-parsing?rev=1406974526&amp;do=diff</link>
        <description>Semantic Dependency Parsing

Soutěž SDP 2015 (bude na SemEvalu, zatím se neví kde).

	*  Stephan chce identifikátory rámců do nového sloupce SENSE. Neřekl, kde by byl, já bych ho dal za dosavadní sloupce TOP a PRED. Sloupec PRED by měl opět boolovské hodnoty jako loni. SENSE může být vyplněn i pro uzel, který nemá děti.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:srilm?rev=1243938857&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-06-02T12:34:17+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:srilm</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:srilm?rev=1243938857&amp;do=diff</link>
        <description>Instalace SRILM

SRILM je nástroj pro jazykové modelování, se kterým pracují mnohé překladače včetně Mosese a Joshuy. Je napsaný v céčku. Způsob, jak ho získat a přeložit, je popsaný v tutoriálu k Mosesovi. (Ten není na webu normálně vidět, ale jeden odkaz na něj vede např. z Trac wiki Gaurav.) Stručně zde opakuji:</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:start?rev=1684244200&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-05-16T15:36:40+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:start</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:start?rev=1684244200&amp;do=diff</link>
        <description>Dan Zeman

&lt;http://ufal.mff.cuni.cz/daniel-zeman&gt;

Virtuální stroje a weby

	*  Biblio. SSH nadále přes ufal, ale web už přes ufal přístupný není, takže přímo &lt;http://10.10.24.239:8080/biblio/?section=publications&gt;.
	*  UD validator:
		*  &lt;https://quest.ms.mff.cuni.cz/udvalidator/cgi-bin/unidep/validation-report.pl&gt;
		*  &lt;https://quest.ms.mff.cuni.cz/udvalidator/cgi-bin/unidep/langspec/specify_auxiliary.pl&gt;

	*  Shared task submission / evaluation site:
		*  &lt;https://quest.ms.mff.cuni.cz/sharedt…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:stopwords?rev=1383857592&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-11-07T21:53:12+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:stopwords</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:stopwords?rev=1383857592&amp;do=diff</link>
        <description>Stopwords

Stopwords (česky bych přeložil jako nezajímavá slova) je poměrně vágně definovaný koncept, který má uplatnění v získávání informací a příbuzných oborech. Jde o slova, která nemá smysl považovat za klíčová při indexování nebo vyhledávání dokumentů, protože tato slova jsou v daném jazyce příliš běžná, takže nemůžeme říct, že charakterizují téma daného dokumentu nebo jeho části. Typicky sem patří funkční slova z uzavřených tříd, např. zájmena, číslovky, předložky, spojky a částice, ale i…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tahak-o-promennych-v-makefilech?rev=1255355874&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-10-12T15:57:54+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:tahak-o-promennych-v-makefilech</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tahak-o-promennych-v-makefilech?rev=1255355874&amp;do=diff</link>
        <description>Proměnné v makefilech

Zdá se, že je úplně jedno, jestli k obsahu proměnné VAR přistupujeme pomocí $(VAR), nebo ${VAR}. Obojí funguje jak pro proměnné definované uvnitř makefilu, tak pro proměnné prostředí zděděné zvenku. Složené závorky mají ale tu výhodu, že se dají zkopírovat do shell skriptu a beze změny fungují. Make zase zná makra, což jsou funkce, jejichž volání vypadá podobně jako přístup k proměnným:</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tahak?rev=1258103586&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-11-13T10:13:06+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:tahak</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tahak?rev=1258103586&amp;do=diff</link>
        <description>Cascaded Style Sheets

Způsoby vkládání stylů do webové stránky

Do &lt;head&gt; dát tohle:
&lt;style type=“text/css”&gt;a { color: red; text-decoration: none }&lt;/style&gt;

Referenční příručka

Reference základních stylů je např. na &lt;http://www.culturedcode.com/css/reference.html&gt;.

Stahování článků povolených jen pro univerzitní IP</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:talbanken05?rev=1216816174&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2008-07-23T14:29:34+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:talbanken05</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:talbanken05?rev=1216816174&amp;do=diff</link>
        <description>[ name = Talbanken05
| owner = zeman
| path = /fs/clip-corpora/conll/swedish
| version = 2006
]

Talbanken05 is the Swedish treebank used in the CoNLL-06 shared task. There are 11,042 training sentences, 191,467 training words, 389 test sentences, and 5,656 test words. Average length of training sentences is 17 words, 15 words for test sentences. The data belong to mixed domains.</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tectomt?rev=1268817705&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2010-03-17T10:21:45+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:tectomt</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tectomt?rev=1268817705&amp;do=diff</link>
        <description>Danovy poznámky k práci s TectoMT

TectoMT

Tato stránka vznikla inventurou v&amp;nbsp;říjnu 2009 po téměř roce, kdy jsem s&amp;nbsp;TectoMT nepracoval.

Moje knihovny kromě bloků

Toto jsou knihovny ve složce libs/other.

	*  rjaz
	*  translit
	*  translit/* (brahmi, khmer, urdu)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tisk-na-ufalu?rev=1505933513&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2017-09-20T20:51:53+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:tisk-na-ufalu</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tisk-na-ufalu?rev=1505933513&amp;do=diff</link>
        <description>Tenhle návod jsem měl kdysi ve společné části wiki (viz &lt;http://wiki.ufal.ms.mff.cuni.cz/printing?rev=1434102357&gt;), ale někdo ho smazal. Značná část už je sice zastaralá, ale některé věci pořád fungují a nový návod k nim nenabízí alternativu.

Částečný update pro Windows 10:

	*</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:transliteration-of-urdu-to-latin-script?rev=1289892321&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2010-11-16T08:25:21+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:transliteration-of-urdu-to-latin-script</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:transliteration-of-urdu-to-latin-script?rev=1289892321&amp;do=diff</link>
        <description>Transliteration of Urdu to Latin Script

Copyright © 2010 by Dan Zeman &lt;zeman@ufal.mff.cuni.cz&gt;
License: GNU GPL
This research has been supported by the grant of the Czech Ministry of Education no. MSM0021620838. 

Transliteration versus Transcription

Transcription of texts among scripts can be guided by two main (often contradicting) principles:</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tred?rev=1689582695&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2023-07-17T10:31:35+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:tred</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tred?rev=1689582695&amp;do=diff</link>
        <description>Není žádný med instalovat Tred

Viz též tred-btred-a-ntred.

(Aktualizace: Milan udělal skript, který realizuje kroky popsané níže, umí tedy nainstalovat Tred na další stroje s novým Ubuntu. Ten skript je /sprava/ADM/patch/ubuntu14.04_install_local_tred.)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:treebank-engineering?rev=1309514931&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2011-07-01T12:08:51+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:treebank-engineering</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:treebank-engineering?rev=1309514931&amp;do=diff</link>
        <description>Treebank Engineering

This page is a place for notes on the project where we experiment with various dependency constructions and their transformations encountered in treebanks. Feel free to edit and to add new stuff!

The project could eventually lead to a journal article. The</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:treebanks?rev=1405611809&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2014-07-17T17:43:29+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:treebanks</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:treebanks?rev=1405611809&amp;do=diff</link>
        <description>Treebanks for Various Languages

&lt;http://ufal.mff.cuni.cz/hamledt/&gt; nebo HamleDT ve Wiki

	*  Ancient Greek (grc)
	*  Arabic (ar)
	*  Basque (eu)
	*  Bengali (bn)
	*  Bulgarian (bg)
	*  Catalan (ca)
	*  Croatian (hr)
	*  Czech (cs)
	*  Danish (da)
	*  Dutch (nl)
	*  English (en)
	*  Estonian (et)
	*  Finnish (fi)
	*  German (de)
	*  Greek (el)
	*  Hindi (hi)
	*  Hungarian (hu)
	*  Italian (it)
	*  Japanese (ja)
	*  Latin (la)
	*  Persian (fa)
	*  Portuguese (pt)
	*  Romanian (ro)
	*  Russian (ru…</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tsd2010?rev=1283958178&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2010-09-08T17:02:58+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:tsd2010</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tsd2010?rev=1283958178&amp;do=diff</link>
        <description>Pokusy s předzpracováním paralelních textů pro TSD 2010

Předzpracování

Zdrojová anglická strana paralelního korpusu se nejdříve prožene značkováním a parsingem v&amp;nbsp;TectoMT. Výsledek se schovává ve složce en.parsed příslušného augmented korpusu jako</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:turecka-morfologie?rev=1371718906&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-06-20T11:01:46+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:turecka-morfologie</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:turecka-morfologie?rev=1371718906&amp;do=diff</link>
        <description>Turecká morfologie

Poznámky k&amp;nbsp;nástrojům a pokusům s&amp;nbsp;tureckou morfologií. Momentálně jde také o poznámky k&amp;nbsp;diplomce Sibel Ciddi (akademický rok 2012-2013).

Úkoly:

	*  Sehnat, rozchodit, natrénovat a otestovat turecký tagger (do 16.6.2013). Možná se dá sehnat tagger s již natrénovaným modelem. Možná nás ale víc zajímá trénovatelný tagger (např. TreeTagger), který bychom si sami natrénovali na treebanku METU, který máme k dispozici. I tak budeme muset řešit nekompatibilitu značek …</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tutorial-pro-moses-na-mt-marathon-v-praze-v-lednu-2009-vedeny-joshem-schroederem?rev=1260956864&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2009-12-16T10:47:44+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:tutorial-pro-moses-na-mt-marathon-v-praze-v-lednu-2009-vedeny-joshem-schroederem</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:tutorial-pro-moses-na-mt-marathon-v-praze-v-lednu-2009-vedeny-joshem-schroederem?rev=1260956864&amp;do=diff</link>
        <description></description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly?rev=1381208153&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-10-08T06:55:53+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:ukoly</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:ukoly?rev=1381208153&amp;do=diff</link>
        <description>Úlohy z počítačového zpracování přirozeného jazyka

Upozornění: Je možné, že některá zde uvedená zadání jsou již rozebrána, nebo dokonce letos vůbec nebyla v nabídce. Dostupnost zadání zjistíte na stránce s&amp;nbsp;rezervačním formulářem.

	*  Pavouk (získávání korpusu z webu)</description>
    </item>
    <item rdf:about="https://wiki.ufal.ms.mff.cuni.cz/user:zeman:wmt?rev=1370969217&amp;do=diff">
        <dc:format>text/html</dc:format>
        <dc:date>2013-06-11T18:46:57+00:00</dc:date>
        <dc:creator>Anonymous (anonymous@undisclosed.example.com)</dc:creator>
        <title>user:zeman:wmt</title>
        <link>https://wiki.ufal.ms.mff.cuni.cz/user:zeman:wmt?rev=1370969217&amp;do=diff</link>
        <description>Danovy pokusy na WMT 2013, Sofija

&lt;http://matrix.statmt.org/&gt;
&lt;http://www.statmt.org/wmt13/translation-task.html&gt;
&lt;http://www.dfki.de/appraise/wmt13/&gt;

/net/work/people/zeman/wmt

Aktuální úkoly

	*  Binarizace a prořezání jazykových modelů. Nějak prořezávat lze i paralelní trénovací data, Edinburgh loni něco takového použil a citoval.
	*  Proč mi letos vyšly tak špatně jazykové páry s češtinou bez angličtiny? Udělal jsem nějakou chybu při vyrábění průniku trénovacích dat? Jsou menší nebo špatn…</description>
    </item>
</rdf:RDF>
