[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
user:zeman:start [2009/02/27 17:40]
zeman Společné ponaučení k úkolům.
user:zeman:start [2023/04/20 15:09]
zeman [Parsing]
Line 1: Line 1:
 ====== Dan Zeman ====== ====== Dan Zeman ======
  
-http://ufal.mff.cuni.cz/~zeman/+http://ufal.mff.cuni.cz/daniel-zeman
  
-===== Moje odkazy =====+===== Virtuální stroje a weby =====
  
 +  * Biblio. SSH nadále přes ufal, ale web už přes ufal přístupný není, takže přímo [[http://10.10.24.239:8080/biblio/?section=publications]].
 +  * UD validator:
 +    * [[https://quest.ms.mff.cuni.cz/udvalidator/cgi-bin/unidep/validation-report.pl]]
 +    * [[https://quest.ms.mff.cuni.cz/udvalidator/cgi-bin/unidep/langspec/specify_auxiliary.pl]]
 +  * Shared task submission / evaluation site:
 +    * [[https://quest.ms.mff.cuni.cz/sharedtask/]]
 +    * SSH skrz quest, pokud se nepletu.
 +  * Quest – CGI služby, které nemají svůj vlastní virtuální stroj:
 +    * [[http://quest.ms.mff.cuni.cz/cgi-bin/interset/index.pl]]
 +    * [[http://quest.ms.mff.cuni.cz/cgi-bin/tagzplorer/index.pl]]
 +    * [[http://quest.ms.mff.cuni.cz/cgi-bin/zeman/translit/translit.pl]]
 +    * Přepočet zeměpisných souřadnic (vstup ze [[https://ufal.mff.cuni.cz/daniel-zeman/zalozky|Záložek]])
 +    * Makra pro zadávání znaků z cizích jazyků (vstup ze [[https://ufal.mff.cuni.cz/daniel-zeman/zalozky|Záložek]])
 +  * CoNLL-U Editor. Není přístupný přes quest, takže jen přímo [[http://10.10.24.50:8890/]].
 +  * Quest – tyhle nejsou moje, ale chci tu na ně mít odkaz:
 +    * [[http://quest.ms.mff.cuni.cz/cgi-bin/elixir/index.fcgi]]
 +
 +===== Universal Dependencies =====
 +
 +  * [[http://universaldependencies.org/|Universal Dependencies]]
 +  * [[http://turkunlp.github.io/docs|Universal Dependencies Turku fork]]
 +  * [[https://github.com/universaldependencies/|Github Universal Dependencies]]
 +  * [[https://github.com/TurkuNLP/docs|Github Turku fork UD v2 docs]]
 +  * [[http://weaver.nlplab.org/ud/#/cicling2015/ru|Cairo CICLing Corpus]]
 +  * [[http://spyysalo.github.io/annodoc/|Annodoc (Sampo Pyysalo)]]
 +  * [[internal:manyla|Manyla]]
 +
 +===== Morfologie =====
 +
 +  * [[Interset|DZ Interset]] | [[http://quest.ms.mff.cuni.cz/cgi-bin/tagzplorer/index.pl|Tagzplorer]] | [[http://quest.ms.mff.cuni.cz/cgi-bin/zeman/translit/translit.pl|Translit]]
 +  * [[Deltacorpus]]
   * [[internal:Morfematický slovník]]   * [[internal:Morfematický slovník]]
-  * [[Moses]] +  * [[Morpho Challenge 2007]] 
-  * [[internal:Hindština]] +  * [[Morpho Challenge 2008]] 
-  * [[Interset|DZ Interset]] +  * [[Brillův tagger]] 
-  * [[internal:TectoMT]] +  * [[PC Kimmo]] 
-  * [[internal:Data CoNLL]]+  * [[Morfologická analýza hindštiny]] 
 +  * [[Turecká morfologie]] 
 +  * [[Stopwords]] 
 + 
 +===== Parsing ===== 
 + 
 +  * Trankit (University of Oregon) 
 +    * Paper: [[https://aclanthology.org/2021.eacl-demos.10/|Nguyen et al. 2021, EACL demos]] or [[https://arxiv.org/abs/2101.03289|arXiv]] (updated later?) 
 +    * Code: [[https://github.com/nlp-uoregon/trankit|Github]] 
 +    * Documentation: [[https://trankit.readthedocs.io/en/latest/overview.html|ReadTheDocs]] 
 +    * On-line demo: [[http://nlp.uoregon.edu/trankit|University of Oregon]] 
 +  * HOPS “honest parser of sentences” [[https://hopsparser.readthedocs.io/en/stable/|Home]] 
 +    * Paper in French: [[https://hal.archives-ouvertes.fr/hal-03223424/file/HOPS_final.pdf|Grobol and Crabbé 2021, TALN-RÉCITAL]] 
 +  * UUParser 
 +  * UDPipe 1 and 2 
 +  * Udify 
 +  * Stanza 
 +  * [[padt:start|Prague Arabic Dependency Treebank]] 
 +  * [[Treebank Engineering]] (for the special issue of Computational Linguistics on parsing morphologically rich languages)
   * [[DZ Parser]]   * [[DZ Parser]]
 +    * [[user:zeman:DZ Parser:CoNLL|CoNLL]]
 +    * [[user:zeman:DZ Parser:ICON|ICON]]
 +    * [[Řízení pokusů pomocí Makefilů]]
 +      * [[mdmake]] (toto je anglicky psaný návod, zatímco předcházející odkaz vede na česky psané úvahy, které tvorbě mdmaku předcházely)
   * [[Parser Adaptation]]   * [[Parser Adaptation]]
     * [[Parsing]] (a copy of the UMIACS wiki parsing page)     * [[Parsing]] (a copy of the UMIACS wiki parsing page)
     * [[:parsery|Brown and Stanford Parsers]]     * [[:parsery|Brown and Stanford Parsers]]
     * [[Self-Training]]     * [[Self-Training]]
-  * [[Morpho Challenge 2007]] +  * [[Malt parser]] 
-  * [[Morpho Challenge 2008]]+    * [[internal:spmrl-2014|SPMRL 2014]] 
 +  * [[HamleDT]] (přehled úkolů) 
 +  * [[Treebanks]] (přehled dostupných treebanků pro HamleDT) 
 +  * [[Semantic Dependency Parsing]] 
 + 
 +===== Strojový překlad ===== 
 + 
 +  * [[Eman]] (Danovy poznámky k používání manažera experimentů) 
 +    * [[Přechod z SVN/Trac na Git/Redmine]] (archiv) 
 +  * [[Příprava paralelního korpusu]] | [[SRILM]] | [[Giza++]] | [[Moses]] | [[Joshua]] 
 +    * [[Tutoriál pro Moses na MT Marathon v Praze v lednu 2009 vedený Joshem Schroederem]] 
 +  * [[internal:Hindština]] | [[https://svn.ms.mff.cuni.cz/projects/statmt|StatMT]] | [[https://svn.ms.mff.cuni.cz/projects/gaurav/wiki/WikiStart|Gaurav Jain]] 
 +  * [[user:zeman:wmt|WMT]] 
 +  * [[user:zeman:tsd2010|TSD 2010]] 
 +  * [[user:zeman:Mojave]] (tohle je česká stránka, kde jsme projekt připravovali, archivovat) 
 +    * [[user:zeman:Addicter]] (tady vzniká anglická dokumentace po skončení MT Marathonu 2010) 
 +  * [[internal:TectoMT]] 
 +    * [[TectoMT|Moje práce s TectoMT]]
   * [[Displaying Giza Alignments in Tred]]   * [[Displaying Giza Alignments in Tred]]
 +  * [[internal:tmt|Tektogramatický strojový překlad]]
 +  * [[user:zeman:Transliteration of Urdu to Latin Script]]
 +  * [[user:zeman:Překlad morfémů]]
 +  * [[user:zeman:Intersecting Parallel Corpora]]
 +  * [[user:zeman:Moses na questu]]
 +
 +===== Perl a taháky =====
 +
 +  * [[user:zeman:lib|Danovy perlové knihovny]]
   * [[Tahák]]   * [[Tahák]]
 +    * [[Tahák o proměnných v makefilech]]
 +    * [[Přechod z tcsh na bash]]
 +    * [[Git]]
 +    * [[Handly v Perlu]]
 +    * [[http://www.cpan.org/misc/cpan-faq.html#How_installed_modules|Pmtools: Jaké moduly Perlu mám nainstalované a jaké verze?]]
 +    * [[Tred]]
 +  * [[Tisk na ÚFALu]]
 +
 +===== Výuka =====
 +
 +  * [[external:npfl094|NPFL094: Morfologická a syntaktická analýza]]
 +  * [[:master-thesis-at-ufal|Master Thesis at ÚFAL]]
   * [[Úkoly]]   * [[Úkoly]]
     * [[user:zeman:ukoly:data|Data k úkolům]]     * [[user:zeman:ukoly:data|Data k úkolům]]
     * [[user:zeman:ukoly:Automatické testování zápočtových úloh]]     * [[user:zeman:ukoly:Automatické testování zápočtových úloh]]
     * [[user:zeman:ukoly:spolecne|Společné ponaučení ke všem úkolům]]     * [[user:zeman:ukoly:spolecne|Společné ponaučení ke všem úkolům]]
-  * [[Brillův tagger]] 
-  * [[Malt parser]] 
-  * [[internal:tmt|Tektogramatický strojový překlad]] 
  
 +===== Různé =====
 +
 +  * [[internal:publikace:biblio|Biblio]]
   * [[internal:cesty:2008:lrec|LREC 2008 Marrákeš]]   * [[internal:cesty:2008:lrec|LREC 2008 Marrákeš]]
   * [[internal:gacr2009|GAČR 2009]]   * [[internal:gacr2009|GAČR 2009]]
Line 33: Line 124:
   * [[Šablona:Infobox resource]]   * [[Šablona:Infobox resource]]
   * https://svn.ms.mff.cuni.cz/projects/rodokmen/   * https://svn.ms.mff.cuni.cz/projects/rodokmen/
 +  * [[Přechod z Windows na Ubuntu]]
 +
 +  * [[internal:zeman:start|internal:zeman]]
 +

[ Back to the navigation ] [ Back to the content ]