[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:rosa:gauk [2015/01/06 17:07]
ufal
user:rosa:gauk [2015/01/06 17:15]
ufal +výroční zpráva
Line 21: Line 21:
 Pracoviště ÚFAL MFF UK Pracoviště ÚFAL MFF UK
  
-===== Řešitelský kolektiv 2015 =====+===== Řešitelský kolektiv ===== 
 + 
 +==== Charakteristika řešitelského kolektivu - rok 2015: ====
 Mgr. Rudolf Rosa Mgr. Rudolf Rosa
 Stipendia 60 Stipendia 60
Line 31: Line 33:
 Stipendia 40 Stipendia 40
  
-===== Řitelský kolektiv 2014 =====+//Hlavní řešitel, Mgr. Rudolf Rosa, je studentem druhého ročníku doktorského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze, v červnu 2013 dokončil navazující magisterské studium tamtéž. Po dobu studia se podílel a podílí na několika výzkumných projektech, zaměřených na zlepšování kvality strojového překladu, a je spoluautorem řady článků prezentovaných na mezinárodních konferencích. Téma grantového projektu je součástí jeho disertace. V projektu se bude soustředit na jeho hlavní cíl, tj. technologie přenosu nástrojů syntaktické analýzy napříč jazyky. 
 +Životopis a seznam vybraných publikací řešitele se nacházejí v příloze. [GAUK1051188] 
 + 
 +Školitel doc. Ing. Zdeněk Žabokrtský Ph. D. je docentem na Ústavu formální a aplikované lingvistiky. Dlouhodobě se zabývá parsingem, závislostní syntaxí, tektogramatickými strukturami, valencí sloves, zdroji lingvistických dat a strojovým překladem. Podílí se na projektu HamleDT, jehož cílem je konverze různých závislostních korpusů do společného formátu a jejich částečná harmonizace, a na nějž navazuje tento grantový projekt. Řešitelům poskytne metodické vedení při výzkumných pracích a přípravě prezentací výsledků. 
 +Životopis a seznam vybraných publikací školitele se nacházejí v přílohách. [GAUK1040080] [GAUK1040081] 
 + 
 +Spoluřešitel Mgr. Martin Popel je studentem šestého ročníku doktorského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze. V rámci projektu naváže na práci předchozího spoluřešitele, Jana Maška -- bude se zabývat shromažďováním existujících syntakticky anotovaných jazykových korpusů a jejich harmonizací do jednotného anotačního schématu. 
 +Životopis a seznam vybraných publikací spoluřešitele se nachází v příloze. [GAUK1051194]// 
 + 
 + 
 +==== Charakteristika řitelského kolektivu - rok 2014====
 Mgr. Rudolf Rosa Mgr. Rudolf Rosa
 Stipendia <del>60</del> 50 Stipendia <del>60</del> 50
Line 46: Line 58:
 Edit: Tak nakonec jsem dostal ještě 10 na GAUKu Ondry Duška (vše zřejmě krátili o 10), Petře GAUK nedali. Edit: Tak nakonec jsem dostal ještě 10 na GAUKu Ondry Duška (vše zřejmě krátili o 10), Petře GAUK nedali.
  
-==== Charakteristika řešitelského kolektivu - rok 2015: ==== 
-//Hlavní řešitel, Mgr. Rudolf Rosa, je studentem druhého ročníku doktorského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze, v červnu 2013 dokončil navazující magisterské studium tamtéž. Po dobu studia se podílel a podílí na několika výzkumných projektech, zaměřených na zlepšování kvality strojového překladu, a je spoluautorem řady článků prezentovaných na mezinárodních konferencích. Téma grantového projektu je součástí jeho disertace. V projektu se bude soustředit na jeho hlavní cíl, tj. technologie přenosu nástrojů syntaktické analýzy napříč jazyky. 
-Životopis a seznam vybraných publikací řešitele se nacházejí v příloze. [GAUK1051188] 
- 
-Školitel doc. Ing. Zdeněk Žabokrtský Ph. D. je docentem na Ústavu formální a aplikované lingvistiky. Dlouhodobě se zabývá parsingem, závislostní syntaxí, tektogramatickými strukturami, valencí sloves, zdroji lingvistických dat a strojovým překladem. Podílí se na projektu HamleDT, jehož cílem je konverze různých závislostních korpusů do společného formátu a jejich částečná harmonizace, a na nějž navazuje tento grantový projekt. Řešitelům poskytne metodické vedení při výzkumných pracích a přípravě prezentací výsledků. 
-Životopis a seznam vybraných publikací školitele se nacházejí v přílohách. [GAUK1040080] [GAUK1040081] 
- 
-Spoluřešitel Mgr. Martin Popel je studentem šestého ročníku doktorského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze. V rámci projektu naváže na práci předchozího spoluřešitele, Jana Maška -- bude se zabývat shromažďováním existujících syntakticky anotovaných jazykových korpusů a jejich harmonizací do jednotného anotačního schématu. 
-Životopis a seznam vybraných publikací spoluřešitele se nachází v příloze. [GAUK1051194]// 
- 
- 
-==== Charakteristika řešitelského kolektivu - rok 2014: ==== 
 //Hlavní řešitel, Mgr. Rudolf Rosa, je studentem prvního ročníku doktorského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze, v červnu 2013 dokončil navazující magisterské studium tamtéž. Po dobu studia se podílel na několika výzkumných projektech, zaměřených na zlepšování kvality strojového překladu, a je spoluautorem řady článků prezentovaných na mezinárodních konferencích. Téma grantového projektu bude součástí jeho disertace. //Hlavní řešitel, Mgr. Rudolf Rosa, je studentem prvního ročníku doktorského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze, v červnu 2013 dokončil navazující magisterské studium tamtéž. Po dobu studia se podílel na několika výzkumných projektech, zaměřených na zlepšování kvality strojového překladu, a je spoluautorem řady článků prezentovaných na mezinárodních konferencích. Téma grantového projektu bude součástí jeho disertace.
 Životopis a publikace řešitele se nacházejí v příloze. [GAUK1039756]  Životopis a publikace řešitele se nacházejí v příloze. [GAUK1039756] 
Line 110: Line 110:
 Rok 2015: 250 Rok 2015: 250
 Rok 2016: 250 Rok 2016: 250
 +
 +===== Výroční zpráva za 2014 =====
 +
 +==== Zpráva o řešení za minulý rok ====
 +//V prvním roce projektu bylo dosaženo vytyčených cílů. Kolekce treebanků HamleDT, která se stala východiskem pro naši práci, byla v mnoha ohledech zkvalitněna (oprava chyb v harmonizaci, sjednocení anotačního schématu), doplněna o další treebanky (polština, slovenština), a rozšířena o konverzi z pražského závislostního stylu do stylu univerzálních Stanfordských závislostí (který se stává de-facto standardem pro závislostní anotaci; navíc její vlastnosti by měly vést k úspěšnější mezijazyčné projekci závislostních stromů). Výsledná kolekce byla vydána pod názvem HamleDT 2.0 a prezentována na konferenci LREC, kde vyvolala značný zájem u mnoha zahraničních kolegů, s několika z nichž jsme poté navázali užší spolupráci.
 +Spoluřešitel Jan Mašek dále implementoval základní verzi nástroje pro automatickou detekci a korekci anotačních a konverzních chyb v morfologicky a syntakticky anotovaných korpusech. Tento nástroj se stane těžištěm jeho diplomové práce.//
 +
 +==== Výhled pro další rok ====
 +//V následujícím roce bude nový spoluřešitel Martin Popel dále pracovat na rozšiřování a zkvalitňování kolekce HamleDT.
 +Rudolf Rosa se bude věnovat úloze mezijazyčné projekce závislostní anotace, kde očekáváme dosažení úspěšnosti srovnatelné s nejlepšími světovými systémy.//
 +
 +==== Komentář k vyčerpaným financím ====
 +//V původním rozpočtu nebyly uvažovány náklady na výrobu posterů pro prezentaci výstupů projektu na konferencích, z tohoto důvodu došlo k drobnému navýšení položky ostatních neinvestičních nákladů a k odpovídajícímu snížení položky cestovného. Až na uvedenou úpravu byly finance čerpány v souladu s původním rozpočtem.
 +Náklady na cestovné byly využity na účast na konferencích plánovaných v původním rozpočtu (LREC, ACL, TLT); neplánované spolufinancování z dalších grantů (MosesCore a SVV) umožnilo navíc účast na konferenci ITAT a krátký studijní pobyt na University of Edinburgh.//
  
 ===== Rozšiřující informace ===== ===== Rozšiřující informace =====

[ Back to the navigation ] [ Back to the content ]