[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/13 16:07]
rosa cíle
user:rosa:gauk [2013/11/13 16:08]
rosa reformát
Line 171: Line 171:
 (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.) (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.)
  
-//Hlavním cílem projektu je dosáhnout světové úrovně v úlohách modelování syntaxe napříč jazyky.+// 
 +Hlavním cílem projektu je dosáhnout světové úrovně v úlohách modelování syntaxe napříč jazyky.
  
-Dosažení snadné přenositelnosti jazykových technologií z jednoho jazyka na jiný +Dosažení snadné přenositelnosti jazykových technologií z jednoho jazyka na jiný jazyk, k němuž existují odpovídající datové zdroje, umožní výzkumníkům vymanit se z omezování se na jeden či několik málo jazyků: vyvinuté nástroje bude možné jednoduše aplikovat na desítky světových jazyků, a tak i snadno porovnat jejich úspěšnost s úspěšností nástrojů vyvinuých jinými výzkumníky. Věříme, že to přispěje k usnadnění a urychlení vývoje v komputační i formální lingvistice.
-jazyk, k němuž existují odpovídající datové zdroje, umožní výzkumníkům vymanit +
-se z omezování se na jeden či několik málo jazyků: vyvinuté nástroje bude možné +
-jednoduše aplikovat na desítky světových jazyků, a tak i snadno porovnat jejich +
-úspěšnost s úspěšností nástrojů vyvinuých jinými výzkumníky. Věříme, že to +
-přispěje k usnadnění a urychlení vývoje v komputační i formální lingvistice.+
  
-Úspěšně zvládnutí techniky mezjazyčné projekce pak umožní pracovat i s takovými +Úspěšně zvládnutí techniky mezjazyčné projekce pak umožní pracovat i s takovými jazyky, pro které dostatečně datové zdroje nejsou k dipozici. Počet jazyků, kterými lidé mluví, se odhaduje na několik tisíc, zatímco zdroje potřebné velikosti a kvality jsou dostupné pouze pro několik desítek z nich. Technologie pro práci s jazyky s omezenými zdroji umožňují použití nástrojů komputační lingvistiky i na tyto jazyky, bez nutnosti nejprve vyvtvořit potřebná data, což je časově i finančně náročné.
-jazyky, pro které dostatečně datové zdroje nejsou k dipozici. Počet jazyků, +
-kterými lidé mluví, se odhaduje na několik tisíc, zatímco zdroje potřebné +
-velikosti a kvality jsou dostupné pouze pro několik desítek z nich. Technologie +
-pro práci s jazyky s omezenými zdroji umožňují použití nástrojů komputační +
-lingvistiky i na tyto jazyky, bez nutnosti nejprve vyvtvořit potřebná data, což +
-je časově i finančně náročné.+
  
-Dílčím cílem projektu je vytvoření velké multilinguální kolekce existujících +Dílčím cílem projektu je vytvoření velké multilinguální kolekce existujících syntakticky anotovaných korpusů (treebanků), harmonizovaných do jednotného anotačního schématu.
-syntakticky anotovaných korpusů (treebanků), harmonizovaných do jednotného +
-anotačního schématu.+
  
-Možností využití této datové sady v komputační lingvistice +Možností využití této datové sady v komputační lingvistice se nabízí celá řada, zejména jako zdroje trénovacích dat pro parsing včetně jeho variant, jako je například delexikalizovaný parsing. Může také posloužit jako testovací data pro neřízenou závislostní analýzu jazyka, kde vynikne jednotnost jejího antačního schématu, která umožní srovnání výsledků pro jednotlivé jazyky s velkou vypovídací hodnotou.
-se nabízí celá řada, zejména jako zdroje trénovacích dat pro parsing včetně jeho +
-variant, jako je například delexikalizovaný parsing. Může také posloužit jako +
-testovací data pro neřízenou závislostní analýzu jazyka, kde vynikne jednotnost +
-jejího antačního schématu, která umožní srovnání výsledků pro jednotlivé jazyky +
-s velkou vypovídací hodnotou.+
  
-Zároveň půjde o cenný zdoj i pro formální lingvisty, kterým umožní snadno +Zároveň půjde o cenný zdoj i pro formální lingvisty, kterým umožní snadno zkoumat všechny jazyky obsažené v kolekci, bez nutnosti seznamovat se pro každý jazyk s jeho anotačním schématem, neboť schéma bude pro všechny jazyky společné.  Zejména ale zásadním způsobem usnadní práci na vzájemném porovnávání jednotlivých jazyků. 
-zkoumat všechny jazyky obsažené v kolekci, bez nutnosti seznamovat se pro každý +//
-jazyk s jeho anotačním schématem, neboť schéma bude pro všechny jazyky společné. +
-Zejména ale zásadním způsobem usnadní práci na vzájemném porovnávání +
-jednotlivých jazyků.//+
  
 (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]]) (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]])

[ Back to the navigation ] [ Back to the content ]