[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/13 13:18]
rosa
user:rosa:gauk [2013/11/13 16:00]
rosa přínos
Line 124: Line 124:
 ==== Přínos projektu k rozvoji fakulty / VŠ: ==== ==== Přínos projektu k rozvoji fakulty / VŠ: ====
 (Popis návaznosti projektu na další řešené projekty tuzemské i zahraniční.) (Popis návaznosti projektu na další řešené projekty tuzemské i zahraniční.)
 +**citace**
 +
 +První část projektu - vytvoření kolekce syntakticky anotovaných
 +korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt
 +HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované
 +lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky v oblasti treebankingu.
 +ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v
 +parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL).
 +
 +Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých
 +na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro
 +studenty doktorského studia
 +lingvistiky, kterým usnadní jejich výzkum -- studenti ÚFALu se věnují například
 +neřízenému parsing (CITE) či jazykovým projekcím (CITE).
 +Kolekce také umožní vytváření dalších odvozených datových zdrojů:
 +ÚFAL je aktivní
 +například v anotaci hloubkových jazykových struktur (CITE), valence (CITE),
 +koreference (CITE) či sentimentu (CITE).
 +
 +Vytvořený datový zdroj bude využitelný i ve výuce některých magisterských
 +předmětů garantovaných ÚFALem, jako jsou Zdroje lingvistických dat, Technologie
 +zpracování přirozeného jazyka či Pražský závislostní korpus.
 +
 +Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí
 +lze využít v předmětech zabývajících se oblastmi data-intesive computing a
 +paralelizací; práci s kolekcí by mohlo být možné využít jako benchmark
 +pro úlohy tohoto typu.
 +
 +Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být
 +přínosné například pro systémy strojového překladu založené na syntaxi, jako je
 +ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap,
 +na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi
 +jinými jazykovými páry, než je jediný v současnosti podporovaný pár
 +angličtina-čeština.
 +
 +Na experimenty samotné pak mohou navázat další diplomové či dizertační práce,
 +rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného
 +typu.
  
-**Napsat znova** 
 (Původní verze zde: [[user:rosa:gauk_backup#prinos-projektu-k-rozvoji-fakulty-vs]]) (Původní verze zde: [[user:rosa:gauk_backup#prinos-projektu-k-rozvoji-fakulty-vs]])
  

[ Back to the navigation ] [ Back to the content ]