[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/13 16:00]
rosa
user:rosa:gauk [2013/11/13 16:06]
rosa
Line 171: Line 171:
 (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.) (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.)
  
-**Napsat znova**+První část projektu - vytvoření kolekce syntakticky anotovaných 
 +korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt 
 +HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované 
 +lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky v oblasti treebankingu. 
 +ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v 
 +parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL). 
 + 
 +Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých 
 +na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro 
 +studenty doktorského studia 
 +lingvistiky, kterým usnadní jejich výzkum -- studenti ÚFALu se věnují například 
 +neřízenému parsing (CITE) či jazykovým projekcím (CITE). 
 +Kolekce také umožní vytváření dalších odvozených datových zdrojů: 
 +ÚFAL je aktivní 
 +například v anotaci hloubkových jazykových struktur (CITE), valence (CITE), 
 +koreference (CITE) či sentimentu (CITE). 
 + 
 +Vytvořený datový zdroj bude využitelný i ve výuce některých magisterských 
 +předmětů garantovaných ÚFALem, jako jsou Zdroje lingvistických dat, Technologie 
 +zpracování přirozeného jazyka či Pražský závislostní korpus. 
 + 
 +Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí 
 +lze využít v předmětech zabývajících se oblastmi data-intesive computing a 
 +paralelizací; práci s kolekcí by mohlo být možné využít jako benchmark 
 +pro úlohy tohoto typu. 
 + 
 +Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být 
 +přínosné například pro systémy strojového překladu založené na syntaxi, jako je 
 +ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap, 
 +na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi 
 +jinými jazykovými páry, než je jediný v současnosti podporovaný pár 
 +angličtina-čeština. 
 + 
 +Na experimenty samotné pak mohou navázat další diplomové či dizertační práce, 
 +rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného 
 +typu. 
 (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]]) (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]])
  

[ Back to the navigation ] [ Back to the content ]