This is an old revision of the document!
Table of Contents
GAUK na HamleDT
Co je kurzívou, to je obsah velkého textového pole – obvykle je požadavek na min. 50 znaků.
Základní informace o projektu č. 1572314
Tady se akorát vymyslí lepší název
Český název projektu: HamleDT
Anglický název projektu: HamleDT
Aktuální řešitel: Mgr. Rudolf Rosa
První žadatel: Rudolf Rosa
Studium: Matematicko-fyzikální fakulta
Program: Informatika
Obor: Matematická lingvistika
Typ studia: doktorské studium
Rok založení projektu: 2014
Délka řešení projektu: 3
Sekce oborové rady: Společenské vědy - Informatika
Pracoviště ÚFAL MFF UK
Historie stavu:
07. 11. 2013 - nový
Řešitelský kolektiv
Mgr. Rudolf Rosa
Stipendia 80
doc. Ing. Zdeněk Žabokrtský Ph.D.
Osobní náklady (mzdy a odvody) 20
Bc. Jan Mašek
Stipendia 40
Charakteristika řešitelského kolektivu - rok 2014:
Mgr. Rudolf Rosa je super doktorand.
Doc. Ing. Zdeněk Žabokrtský Ph.D. je super docent.
Bc. Jan Mašek je super magistrand.
Finanční požadavky
Položky Rok 2014
Ostatní neinvestiční náklady 10
Cestovné 40
Doplňkové náklady 28
Osobní náklady (mzdy) a stipendia 140
Celkem 218
Struktura finančních prostředků - rok 2014:
Koupíme si harddisk a kancelářské potřeby.
Pojedem na LREC a TLT a zkusíme ACL.
Finanční výhled na další roky
Rok 2015: 250
Rok 2016: 250
Rozšiřující informace
Anotace:
Vylepšení harmonizace treebanků - teď se neřeší spousta věcí a má to spousty chyb.
Přidání nových treebanků.
Testování konzistentnosti harmonizovaných treebanků, na to navázané další vylepšování harmonizace.
Zkoumání přenositelnosti znalostí a technologií mezi jazykama, zjišťování co je jazykově specifické a co je více či méně “univerzální”. Cross-linguální a multilinguální experimenty, např. delexikalizovaný parsing nebo joint parsing.
Anotace v anglickém jazyce:
To se přeloží až to bude česky.
Současný stav poznání:
Teď je bžilión treebanků s různorodými anotačními schématy atd. Taky je HamleDT a Universal Dependency Treebanks, kdy HamleDT je dobrej ale má ty a ty problémy, a UDT je malej…
Přínos projektu k rozvoji fakulty / VŠ:
Posuneme hranice poznání, umožníme lepší nadhled při treebankingu, který tu má dlouhou tradici, stvoříme cenný datový zdroj pro multilinguální experimenty, např. pro unsupervised parsing…
Materiální zajištění projektu:
V poho, ale mohli bysme asi koupit harddisk.
Cíle řešení projektu:
Vytvoření datového zdroje HamleDT 2.5, prozkoumání jazykové specifičnosti a univerzálnosti různých vlastností jazyků a jazykových jevů.
Způsob řešení:
Budem testovat treebanky v HamleDT, tím najdeme chyby v konverzi.
Na základě toho budem opravovat chyby v konverzi (iterativní proces).
Což povede ke vzniku HamleDT 2.5.
Taky budeme experimentálně ověřovat přenositelnost technologií a znalostí mezi jazyky, což lze provést například experimenty s delexikalizovaným parsingem nebo joint parsingem.
Prezentace výsledků:
Posíláme to na LREC, pošleme to na TLT, zkusím to i na ACL. A možná to odprezentuju i na WDS.
Přílohy
ASI: Moje CV, moje publikace, ZŽ CV, ZŽ publikace, HM CV.