[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/13 16:06]
rosa
user:rosa:gauk [2013/11/13 16:07]
rosa cíle
Line 171: Line 171:
 (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.) (Předpokládaný výsledek a jeho využití, význam projektu pro praxi a společnost.)
  
-První část projektu - vytvoření kolekce syntakticky anotovaných +//Hlavním cílem projektu je dosáhnout světové úrovně úlohách modelování syntaxe napříč jazyky.
-korpusů (treebanků) s jednotným anotačním schématem - přímo navazuje na projekt +
-HamleDT (CITE). Výstupy této práce umožní Ústavu formální a aplikované +
-lingvistiky (ÚFAL) udržet si prestiž a úroveň světové špičky oblasti treebankingu. +
-ÚFAL by se díky této kolekci například mohl pokusit o zorganizování soutěže v +
-parsingu, navazující na úspěšné soutěže tohoto typu v minulosti (CITE CoNLL).+
  
-Zejména díky svému velkému rozsahu, jakož i existenci mnoha nástrojů vyvinutých +Dosažení snadné přenositelnosti jazykových technologií z jednoho jazyka na jiný 
-na ÚFALu pro práci s daty tohoto typu, se kolekce stane cenným zdrojem pro +jazykk němuž existují odpovídající datové zdroje, umožní výzkumníkům vymanit 
-studenty doktorského studia +se z omezování se na jeden či několik málo jazyků: vyvinuté nástroje bude možné 
-lingvistikykterým usnadní jejich výzkum -- studenti ÚFALu se věnují například +jednoduše aplikovat na desítky světových jazyků, a tak i snadno porovnat jejich 
-neřízenému parsing (CITE) či jazykovým projekcím (CITE). +úspěšnost s úspěšností nástrojů vyvinuých jinými výzkumníky. Věřímeže to 
-Kolekce také umožní vytváření dalších odvozených datových zdrojů: +přispěje k usnadnění a urychlení vývoje v komputační formální lingvistice.
-ÚFAL je aktivní +
-například v anotaci hloubkových jazykových struktur (CITE), valence (CITE)+
-koreference (CITE) či sentimentu (CITE).+
  
-Vytvořený datový zdroj bude využitelný ve výuce kterých magisterských +Úspěšně zvládnutí techniky mezjazyčné projekce pak umožní pracovat s takovými 
-předmětů garantovaných ÚFALemjako jsou Zdroje lingvistických dat, Technologie +jazyky, pro které dostatečně datové zdroje nejsou k dipozici. Počet jazyků, 
-zpracování přirozeného jazyka či Pražský závislostní korpus.+kterými lidé mluví, se odhaduje na několik tisíczatímco zdroje potřebné 
 +velikosti a kvality jsou dostupné pouze pro několik desítek z nich. Technologie 
 +pro práci s jazyky s omezenými zdroji umožňují použití nástrojů komputační 
 +lingvistiky na tyto jazyky, bez nutnosti nejprve vyvtvořit potřebná data, což 
 +je časově i finančně náročné.
  
-Potřebu masivně paralelního zpracovávání velkých dat při práci s kolekcí +Dílčím cílem projektu je vytvoření velké multilinguální kolekce existujících 
-lze využít v předmětech zabývajících se oblastmi data-intesive computing a +syntakticky anotovaných korpusů (treebanků), harmonizovaných do jednotného 
-paralelizací; práci s kolekcí by mohlo být možné využít jako benchmark +anotačního schématu.
-pro úlohy tohoto typu.+
  
-Poznatky získané experimenty s modelováním syntaxe napříč jazyky mohou být +Možností využití této datové sady v komputační lingvistice 
-přínosné například pro systémy strojového překladu založené na syntaxi, jako je +se nabízí celá řada, zejména jako zdroje trénovacích dat pro parsing včetně jeho 
-ÚFALem vyvíjené TectoMT (CITE), a s ním související mezinárodní projekt QTLeap+variant, jako je například delexikalizovaný parsing. Může také posloužit jako 
-na němž se ústav podílí. ÚFALu by se tak mohly otevřít dveře k překladu mezi +testovací data pro neřízenou závislostní analýzu jazykakde vynikne jednotnost 
-jinými jazykovými párynež je jediný v současnosti podporovaný pár +jejího antačního schématukterá umožní srovnání výsledků pro jednotlivé jazyky 
-angličtina-čeština.+s velkou vypovídací hodnotou.
  
-Na experimenty samotné pak mohou navázat další diplomové čdizertační práce+Zároveň půjde o cenný zdoj pro formální lingvisty, kterým umožní snadno 
-rozšiřující a prohlubující tyto experimenty a přinášející nové experimenty podobného +zkoumat všechny jazyky obsažené v kolekcibez nutnosti seznamovat se pro každý 
-typu.+jazyk s jeho anotačním schématem, neboť schéma bude pro všechny jazyky společné. 
 +Zejména ale zásadním způsobem usnadní práci na vzájemném porovnávání 
 +jednotlivých jazyků.//
  
 (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]]) (Původní verze zde: [[user:rosa:gauk_backup#cile-reseni-projektu]])

[ Back to the navigation ] [ Back to the content ]