Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:rosa:gauk [2013/11/13 16:08] rosa reformát |
user:rosa:gauk [2013/11/13 16:09] rosa reformát |
||
---|---|---|---|
Line 126: | Line 126: | ||
**TODO citace** | **TODO citace** | ||
- | První část projektu - vytvoření kolekce syntakticky anotovaných | + | // |
- | korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt | + | První část projektu - vytvoření kolekce syntakticky anotovaných korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky v oblasti treebankingu. |
- | HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované | + | |
- | lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky v oblasti treebankingu. | + | |
- | ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v | + | |
- | parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL). | + | |
- | Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých | + | Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro studenty doktorského studia lingvistiky, |
- | na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro | + | |
- | studenty doktorského studia | + | |
- | lingvistiky, | + | |
- | neřízenému parsing (CITE) či jazykovým projekcím (CITE). | + | |
- | Kolekce také umožní vytváření dalších odvozených datových zdrojů: | + | |
- | ÚFAL je aktivní | + | |
- | například v anotaci hloubkových jazykových struktur (CITE), valence (CITE), | + | |
- | koreference (CITE) či sentimentu (CITE). | + | |
- | Vytvořený datový zdroj bude využitelný i ve výuce některých magisterských | + | Vytvořený datový zdroj bude využitelný i ve výuce některých magisterských předmětů garantovaných ÚFALem, jako jsou Zdroje lingvistických dat, Technologie zpracování přirozeného jazyka či Pražský závislostní korpus. |
- | předmětů garantovaných ÚFALem, jako jsou Zdroje lingvistických dat, Technologie | + | |
- | zpracování přirozeného jazyka či Pražský závislostní korpus. | + | |
- | Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí | + | Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí lze využít v předmětech zabývajících se oblastmi data-intesive computing a paralelizací; |
- | lze využít v předmětech zabývajících se oblastmi data-intesive computing a | + | |
- | paralelizací; | + | |
- | pro úlohy tohoto typu. | + | |
- | Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být | + | Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být přínosné například pro systémy strojového překladu založené na syntaxi, jako je ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap, na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi jinými jazykovými páry, než je jediný v současnosti podporovaný pár angličtina-čeština. |
- | přínosné například pro systémy strojového překladu založené na syntaxi, jako je | + | |
- | ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap, | + | |
- | na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi | + | |
- | jinými jazykovými páry, než je jediný v současnosti podporovaný pár | + | |
- | angličtina-čeština. | + | |
- | Na experimenty samotné pak mohou navázat další diplomové či dizertační práce, | + | Na experimenty samotné pak mohou navázat další diplomové či dizertační práce, rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného typu. |
- | rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného | + | // |
- | typu. | + | |
(Původní verze zde: [[user: | (Původní verze zde: [[user: |