[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/13 16:06]
rosa
user:rosa:gauk [2013/11/13 16:09]
rosa reformát
Line 126: Line 126:
 **TODO citace** **TODO citace**
  
-První část projektu - vytvoření kolekce syntakticky anotovaných +// 
-korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt +První část projektu - vytvoření kolekce syntakticky anotovaných korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky v oblasti treebankingu.  ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL).
-HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované +
-lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky v oblasti treebankingu. +
-ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v +
-parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL).+
  
-Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých +Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro studenty doktorského studia lingvistiky, kterým usnadní jejich výzkum -- studenti ÚFALu se věnují například neřízenému parsing (CITE) či jazykovým projekcím (CITE).  Kolekce také umožní vytváření dalších odvozených datových zdrojů: ÚFAL je aktivní například v anotaci hloubkových jazykových struktur (CITE), valence (CITE), koreference (CITE) či sentimentu (CITE).
-na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro +
-studenty doktorského studia +
-lingvistiky, kterým usnadní jejich výzkum -- studenti ÚFALu se věnují například +
-neřízenému parsing (CITE) či jazykovým projekcím (CITE). +
-Kolekce také umožní vytváření dalších odvozených datových zdrojů: +
-ÚFAL je aktivní +
-například v anotaci hloubkových jazykových struktur (CITE), valence (CITE), +
-koreference (CITE) či sentimentu (CITE).+
  
-Vytvořený datový zdroj bude využitelný i ve výuce některých magisterských +Vytvořený datový zdroj bude využitelný i ve výuce některých magisterských předmětů garantovaných ÚFALem, jako jsou Zdroje lingvistických dat, Technologie zpracování přirozeného jazyka či Pražský závislostní korpus.
-předmětů garantovaných ÚFALem, jako jsou Zdroje lingvistických dat, Technologie +
-zpracování přirozeného jazyka či Pražský závislostní korpus.+
  
-Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí +Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí lze využít v předmětech zabývajících se oblastmi data-intesive computing a paralelizací; práci s kolekcí by mohlo být možné využít jako benchmark pro úlohy tohoto typu.
-lze využít v předmětech zabývajících se oblastmi data-intesive computing a +
-paralelizací; práci s kolekcí by mohlo být možné využít jako benchmark +
-pro úlohy tohoto typu.+
  
-Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být +Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být přínosné například pro systémy strojového překladu založené na syntaxi, jako je ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap, na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi jinými jazykovými páry, než je jediný v současnosti podporovaný pár angličtina-čeština.
-přínosné například pro systémy strojového překladu založené na syntaxi, jako je +
-ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap, +
-na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi +
-jinými jazykovými páry, než je jediný v současnosti podporovaný pár +
-angličtina-čeština.+
  
-Na experimenty samotné pak mohou navázat další diplomové či dizertační práce, +Na experimenty samotné pak mohou navázat další diplomové či dizertační práce, rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného typu. 
-rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného +//
-typu.+
  
 (Původní verze zde: [[user:rosa:gauk_backup#prinos-projektu-k-rozvoji-fakulty-vs]]) (Původní verze zde: [[user:rosa:gauk_backup#prinos-projektu-k-rozvoji-fakulty-vs]])
Line 171: Line 148:
 (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.) (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.)
  
-První část projektu - vytvoření kolekce syntakticky anotovaných +// 
-korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt +Hlavním cílem projektu je dosáhnout světové úrovně úlohách modelování syntaxe napříč jazyky.
-HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované +
-lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky oblasti treebankingu. +
-ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v +
-parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL).+
  
-Zejména díky svému velkému rozsahujakož i existenci mnoha nástrojů vyvinutých +Dosažení snadné přenositelnosti jazykových technologií z jednoho jazyka na jiný jazykk němuž existují odpovídající datové zdroje, umožní výzkumníkům vymanit se z omezování se na jeden čněkolik málo jazyků: vyvinuté nástroje bude možné jednoduše aplikovat na desítky světových jazykůa tak i snadno porovnat jejich úspěšnost s úspěšností nástrojů vyvinuých jinými výzkumníkyVěříme, že to přispěje k usnadnění a urychlení vývoje komputační formální lingvistice.
-na ÚFALu pro práci s daty tohoto typuse kolekce stane cenným zdrojem pro +
-studenty doktorského studia +
-lingvistiky, kterým usnadní jejich výzkum -- studenti ÚFALu se věnují například +
-neřízenému parsing (CITE) či jazykovým projekcím (CITE). +
-Kolekce také umožní vytváření dalších odvozených datových zdrojů: +
-ÚFAL je aktivní +
-například anotaci hloubkových jazykových struktur (CITE), valence (CITE), +
-koreference (CITE) či sentimentu (CITE).+
  
-Vytvořený datový zdroj bude využitelný ve výuce kterých magisterských +Úspěšně zvládnutí techniky mezjazyčné projekce pak umožní pracovat s takovými jazyky, pro které dostatečně datové zdroje nejsou k dipozici. Počet jazyků, kterými lidé mluvíse odhaduje na několik tisíc, zatímco zdroje potřebné velikosti a kvality jsou dostupné pouze pro několik desítek z nich. Technologie pro práci s jazyky s omezenými zdroji umožňují použití nástrojů komputační lingvistiky na tyto jazyky, bez nutnosti nejprve vyvtvořit potřebná data, což je časově i finančně náročné.
-předmětů garantovaných ÚFALemjako jsou Zdroje lingvistických datTechnologie +
-zpracování přirozeného jazyka či Pražský závislostní korpus.+
  
-Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí +Dílčím cílem projektu je vytvoření velké multilinguální kolekce existujících syntakticky anotovaných korpusů (treebanků), harmonizovaných do jednotného anotačního schématu.
-lze využít v předmětech zabývajících se oblastmi data-intesive computing a +
-paralelizací; práci s kolekcí by mohlo být možné využít jako benchmark +
-pro úlohy tohoto typu.+
  
-Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být +Možností využití této datové sady v komputační lingvistice se nabízí celá řada, zejména jako zdroje trénovacích dat pro parsing včetně jeho variant, jako je například delexikalizovaný parsing. Může také posloužit jako testovací data pro neřízenou závislostní analýzu jazykakde vynikne jednotnost jejího antačního schématu, která umožní srovnání výsledků pro jednotlivé jazyky s velkou vypovídací hodnotou.
-přínosné například pro systémy strojového překladu založené na syntaxi, jako je +
-ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap, +
-na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveřk překladu mezi +
-jinými jazykovými párynež je jediný v současnosti podporovaný pár +
-angličtina-čeština.+
  
-Na experimenty samotné pak mohou navázat další diplomové čdizertační práce, +Zároveň půjde o cenný zdoj pro formální lingvisty, kterým umožní snadno zkoumat všechny jazyky obsažené v kolekcibez nutnosti seznamovat se pro každý jazyk s jeho anotačním schématem, neboť schéma bude pro všechny jazyky společné Zejména ale zásadním způsobem usnadní práci na vzájemném porovnávání jednotlivých jazyků. 
-rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného +//
-typu.+
  
 (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]]) (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]])

[ Back to the navigation ] [ Back to the content ]