Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:rosa:gauk [2013/11/13 11:40] rosa |
user:rosa:gauk [2013/11/13 16:00] rosa přínos |
||
---|---|---|---|
Line 42: | Line 42: | ||
Životopis a publikace školitele se nacházejí v přílohách. [GAUK1040080] [GAUK1040081] | Životopis a publikace školitele se nacházejí v přílohách. [GAUK1040080] [GAUK1040081] | ||
- | Spoluřešitel Bc. Jan Mašek je studentem druhého ročníku magisterského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze, v září 2012 absolvoval bakalářské studium Mezikulturní komunikace - angličtina - čeština a Obecné jazykovědy na Filozofické fakultě UK. Podílel se jako anotátor na projektech Prague English Dependency Treebank 1.0 a 2.0 a od ledna 2013 se podílí na projektu SEANCe, analýzy sentimentu v češtině. Téma grantového projektu odpovídá tématu jeho diplomové práce. Pro jeho lingvistické vzdělání | + | Spoluřešitel Bc. Jan Mašek je studentem druhého ročníku magisterského studia Matematické lingvistiky na Ústavu formální a aplikované lingvistiky MFF UK v Praze, v září 2012 absolvoval bakalářské studium Mezikulturní komunikace - angličtina - čeština a Obecné jazykovědy na Filozofické fakultě UK. Podílel se jako anotátor na projektech Prague English Dependency Treebank 1.0 a 2.0 a od ledna 2013 se podílí na projektu SEANCe, analýzy sentimentu v češtině. Téma grantového projektu odpovídá tématu jeho diplomové práce. Pro jeho lingvistické vzdělání a zkušenosti |
- | Životopis spoluřešitele se nachází v příloze. | + | Životopis spoluřešitele se nachází v příloze. [GAUK1040145]// |
===== Finanční požadavky ===== | ===== Finanční požadavky ===== | ||
Line 124: | Line 124: | ||
==== Přínos projektu k rozvoji fakulty / VŠ: ==== | ==== Přínos projektu k rozvoji fakulty / VŠ: ==== | ||
(Popis návaznosti projektu na další řešené projekty tuzemské i zahraniční.) | (Popis návaznosti projektu na další řešené projekty tuzemské i zahraniční.) | ||
+ | **citace** | ||
+ | |||
+ | První část projektu - vytvoření kolekce syntakticky anotovaných | ||
+ | korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt | ||
+ | HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované | ||
+ | lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky v oblasti treebankingu. | ||
+ | ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v | ||
+ | parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL). | ||
+ | |||
+ | Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých | ||
+ | na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro | ||
+ | studenty doktorského studia | ||
+ | lingvistiky, | ||
+ | neřízenému parsing (CITE) či jazykovým projekcím (CITE). | ||
+ | Kolekce také umožní vytváření dalších odvozených datových zdrojů: | ||
+ | ÚFAL je aktivní | ||
+ | například v anotaci hloubkových jazykových struktur (CITE), valence (CITE), | ||
+ | koreference (CITE) či sentimentu (CITE). | ||
+ | |||
+ | Vytvořený datový zdroj bude využitelný i ve výuce některých magisterských | ||
+ | předmětů garantovaných ÚFALem, jako jsou Zdroje lingvistických dat, Technologie | ||
+ | zpracování přirozeného jazyka či Pražský závislostní korpus. | ||
+ | |||
+ | Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí | ||
+ | lze využít v předmětech zabývajících se oblastmi data-intesive computing a | ||
+ | paralelizací; | ||
+ | pro úlohy tohoto typu. | ||
+ | |||
+ | Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být | ||
+ | přínosné například pro systémy strojového překladu založené na syntaxi, jako je | ||
+ | ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap, | ||
+ | na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi | ||
+ | jinými jazykovými páry, než je jediný v současnosti podporovaný pár | ||
+ | angličtina-čeština. | ||
+ | |||
+ | Na experimenty samotné pak mohou navázat další diplomové či dizertační práce, | ||
+ | rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného | ||
+ | typu. | ||
- | **Napsat znova** | ||
(Původní verze zde: [[user: | (Původní verze zde: [[user: | ||