====== Dan Zeman ====== http://ufal.mff.cuni.cz/daniel-zeman ===== Virtuální stroje a weby ===== * Biblio. SSH nadále přes ufal, ale web už přes ufal přístupný není, takže přímo [[http://10.10.24.239:8080/biblio/?section=publications]]. * UD validator: * [[https://quest.ms.mff.cuni.cz/udvalidator/cgi-bin/unidep/validation-report.pl]] * [[https://quest.ms.mff.cuni.cz/udvalidator/cgi-bin/unidep/langspec/specify_auxiliary.pl]] * Shared task submission / evaluation site: * [[https://quest.ms.mff.cuni.cz/sharedtask/]] * SSH skrz quest, pokud se nepletu. * Quest – CGI služby, které nemají svůj vlastní virtuální stroj: * [[http://quest.ms.mff.cuni.cz/cgi-bin/interset/index.pl]] * [[http://quest.ms.mff.cuni.cz/cgi-bin/tagzplorer/index.pl]] * [[http://quest.ms.mff.cuni.cz/cgi-bin/zeman/translit/translit.pl]] * Přepočet zeměpisných souřadnic (vstup ze [[https://ufal.mff.cuni.cz/daniel-zeman/zalozky|Záložek]]) * Makra pro zadávání znaků z cizích jazyků (vstup ze [[https://ufal.mff.cuni.cz/daniel-zeman/zalozky|Záložek]]) * CoNLL-U Editor. Není přístupný přes quest, takže jen přímo [[http://10.10.24.50:8890/]]. * Quest – tyhle nejsou moje, ale chci tu na ně mít odkaz: * [[http://quest.ms.mff.cuni.cz/cgi-bin/elixir/index.fcgi]] * PML-TQ – bývalý euler – 10.10.51.124 ===== Universal Dependencies ===== * [[http://universaldependencies.org/|Universal Dependencies]] * [[http://turkunlp.github.io/docs|Universal Dependencies Turku fork]] * [[https://github.com/universaldependencies/|Github Universal Dependencies]] * [[https://github.com/TurkuNLP/docs|Github Turku fork UD v2 docs]] * [[http://weaver.nlplab.org/ud/#/cicling2015/ru|Cairo CICLing Corpus]] * [[http://spyysalo.github.io/annodoc/|Annodoc (Sampo Pyysalo)]] * [[internal:manyla|Manyla]] ===== Morfologie ===== * [[Interset|DZ Interset]] | [[http://quest.ms.mff.cuni.cz/cgi-bin/tagzplorer/index.pl|Tagzplorer]] | [[http://quest.ms.mff.cuni.cz/cgi-bin/zeman/translit/translit.pl|Translit]] * [[Deltacorpus]] * [[internal:Morfematický slovník]] * [[Morpho Challenge 2007]] * [[Morpho Challenge 2008]] * [[Brillův tagger]] * [[PC Kimmo]] * [[Morfologická analýza hindštiny]] * [[Turecká morfologie]] * [[Stopwords]] ===== Parsing ===== * Trankit (University of Oregon) * Paper: [[https://aclanthology.org/2021.eacl-demos.10/|Nguyen et al. 2021, EACL demos]] or [[https://arxiv.org/abs/2101.03289|arXiv]] (updated later?) * Code: [[https://github.com/nlp-uoregon/trankit|Github]] * Documentation: [[https://trankit.readthedocs.io/en/latest/overview.html|ReadTheDocs]] * On-line demo: [[http://nlp.uoregon.edu/trankit|University of Oregon]] * HOPS “honest parser of sentences” [[https://hopsparser.readthedocs.io/en/stable/|Home]] * Paper in French: [[https://hal.archives-ouvertes.fr/hal-03223424/file/HOPS_final.pdf|Grobol and Crabbé 2021, TALN-RÉCITAL]] * UUParser * UDPipe 1 and 2 * Udify * Stanza * [[padt:start|Prague Arabic Dependency Treebank]] * [[Treebank Engineering]] (for the special issue of Computational Linguistics on parsing morphologically rich languages) * [[DZ Parser]] * [[user:zeman:DZ Parser:CoNLL|CoNLL]] * [[user:zeman:DZ Parser:ICON|ICON]] * [[Řízení pokusů pomocí Makefilů]] * [[mdmake]] (toto je anglicky psaný návod, zatímco předcházející odkaz vede na česky psané úvahy, které tvorbě mdmaku předcházely) * [[Parser Adaptation]] * [[Parsing]] (a copy of the UMIACS wiki parsing page) * [[:parsery|Brown and Stanford Parsers]] * [[Self-Training]] * [[Malt parser]] * [[internal:spmrl-2014|SPMRL 2014]] * [[HamleDT]] (přehled úkolů) * [[Treebanks]] (přehled dostupných treebanků pro HamleDT) * [[Semantic Dependency Parsing]] ===== Strojový překlad ===== * [[Eman]] (Danovy poznámky k používání manažera experimentů) * [[Přechod z SVN/Trac na Git/Redmine]] (archiv) * [[Příprava paralelního korpusu]] | [[SRILM]] | [[Giza++]] | [[Moses]] | [[Joshua]] * [[Tutoriál pro Moses na MT Marathon v Praze v lednu 2009 vedený Joshem Schroederem]] * [[internal:Hindština]] | [[https://svn.ms.mff.cuni.cz/projects/statmt|StatMT]] | [[https://svn.ms.mff.cuni.cz/projects/gaurav/wiki/WikiStart|Gaurav Jain]] * [[user:zeman:wmt|WMT]] * [[user:zeman:tsd2010|TSD 2010]] * [[user:zeman:Mojave]] (tohle je česká stránka, kde jsme projekt připravovali, archivovat) * [[user:zeman:Addicter]] (tady vzniká anglická dokumentace po skončení MT Marathonu 2010) * [[internal:TectoMT]] * [[TectoMT|Moje práce s TectoMT]] * [[Displaying Giza Alignments in Tred]] * [[internal:tmt|Tektogramatický strojový překlad]] * [[user:zeman:Transliteration of Urdu to Latin Script]] * [[user:zeman:Překlad morfémů]] * [[user:zeman:Intersecting Parallel Corpora]] * [[user:zeman:Moses na questu]] ===== Perl a taháky ===== * [[user:zeman:lib|Danovy perlové knihovny]] * [[Tahák]] * [[Tahák o proměnných v makefilech]] * [[Přechod z tcsh na bash]] * [[Git]] * [[Handly v Perlu]] * [[http://www.cpan.org/misc/cpan-faq.html#How_installed_modules|Pmtools: Jaké moduly Perlu mám nainstalované a jaké verze?]] * [[Tred]] * [[Tisk na ÚFALu]] ===== Výuka ===== * [[external:npfl094|NPFL094: Morfologická a syntaktická analýza]] * [[:master-thesis-at-ufal|Master Thesis at ÚFAL]] * [[Úkoly]] * [[user:zeman:ukoly:data|Data k úkolům]] * [[user:zeman:ukoly:Automatické testování zápočtových úloh]] * [[user:zeman:ukoly:spolecne|Společné ponaučení ke všem úkolům]] ===== Různé ===== * [[internal:publikace:biblio|Biblio]] * [[internal:cesty:2008:lrec|LREC 2008 Marrákeš]] * [[internal:gacr2009|GAČR 2009]] * [[Šablona:Infobox resource]] * https://svn.ms.mff.cuni.cz/projects/rodokmen/ * [[Přechod z Windows na Ubuntu]] * [[internal:zeman:start|internal:zeman]]