Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:rosa:gauk [2013/11/13 16:00] rosa |
user:rosa:gauk [2013/11/13 16:07] rosa cíle |
||
---|---|---|---|
Line 171: | Line 171: | ||
(Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.) | (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.) | ||
- | **Napsat znova** | + | //Hlavním cílem projektu je dosáhnout světové úrovně v úlohách modelování syntaxe napříč jazyky. |
+ | |||
+ | Dosažení snadné přenositelnosti jazykových technologií z jednoho jazyka na jiný | ||
+ | jazyk, k němuž existují odpovídající datové zdroje, umožní výzkumníkům vymanit | ||
+ | se z omezování se na jeden či několik málo jazyků: vyvinuté nástroje bude možné | ||
+ | jednoduše aplikovat na desítky světových jazyků, a tak i snadno porovnat jejich | ||
+ | úspěšnost s úspěšností nástrojů vyvinuých jinými výzkumníky. Věříme, že to | ||
+ | přispěje k usnadnění a urychlení vývoje v komputační i formální lingvistice. | ||
+ | |||
+ | Úspěšně zvládnutí techniky mezjazyčné projekce pak umožní pracovat i s takovými | ||
+ | jazyky, pro které dostatečně datové zdroje nejsou k dipozici. Počet jazyků, | ||
+ | kterými lidé mluví, se odhaduje na několik tisíc, zatímco zdroje potřebné | ||
+ | velikosti a kvality jsou dostupné pouze pro několik desítek z nich. Technologie | ||
+ | pro práci s jazyky s omezenými zdroji umožňují použití nástrojů komputační | ||
+ | lingvistiky i na tyto jazyky, bez nutnosti nejprve vyvtvořit potřebná data, což | ||
+ | je časově i finančně náročné. | ||
+ | |||
+ | Dílčím cílem projektu je vytvoření velké multilinguální kolekce existujících | ||
+ | syntakticky anotovaných korpusů (treebanků), | ||
+ | anotačního schématu. | ||
+ | |||
+ | Možností využití této datové sady v komputační lingvistice | ||
+ | se nabízí celá řada, zejména jako zdroje trénovacích dat pro parsing včetně jeho | ||
+ | variant, jako je například delexikalizovaný parsing. Může také posloužit jako | ||
+ | testovací data pro neřízenou závislostní analýzu jazyka, kde vynikne jednotnost | ||
+ | jejího antačního schématu, která umožní srovnání výsledků pro jednotlivé jazyky | ||
+ | s velkou vypovídací hodnotou. | ||
+ | |||
+ | Zároveň půjde o cenný zdoj i pro formální lingvisty, kterým umožní snadno | ||
+ | zkoumat všechny jazyky obsažené v kolekci, bez nutnosti seznamovat se pro každý | ||
+ | jazyk s jeho anotačním schématem, neboť schéma bude pro všechny jazyky společné. | ||
+ | Zejména ale zásadním způsobem usnadní práci na vzájemném porovnávání | ||
+ | jednotlivých jazyků.// | ||
(Původní verze zde: [[user: | (Původní verze zde: [[user: | ||