[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/13 00:20]
rosa
user:rosa:gauk [2013/11/13 00:25]
rosa
Line 83: Line 83:
 // //
 V grantovém projektu budeme zkoumat vzájemné podobnosti přirozených jazyků, a získané poznatky využijeme pro dva typy úloh komputační lingvistiky, řešících aktuální problémy zpracování jazyka na úrovni syntaxe. V grantovém projektu budeme zkoumat vzájemné podobnosti přirozených jazyků, a získané poznatky využijeme pro dva typy úloh komputační lingvistiky, řešících aktuální problémy zpracování jazyka na úrovni syntaxe.
-Prvním typem úloh budou technologie mezijazyčné projekce, kdy schopnost zpracovávat jeden jazyk využijeme pro zpracování jazyka podobného, pro který nemáme dostatečné jazykové zdroje. +Prvním typem úloh budou technologie mezijazyčné projekce, kdy model jednoho jazyka využijeme pro přibližné zpracování jazyka podobného, pro který nemáme dostatečné jazykové zdroje. 
-Druhým typem bude přenositelnost jednojazyčných technologií, kdy nástroje a postupy vyvinuté pro práci s jedním jazykem adaptujeme pro práci s jinými jazyky.+Druhým typem bude přenositelnost jednojazyčných technologií, kdy zobecníme některé nástroje a postupy vyvinuté pro práci s jedním či několika málo jazyky, tak aby umožňovaly zpracování téměř libovolného jazyka, pro který existují odpovídající datové zdroje.
  
 Přestože existují rozsáhlé jazykové zdroje pro mnoho jazyků, v praxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešit. Dostupné zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny na základě odlišných lingvistických tradic a konvencí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících syntakticky anotovaných jazykových korpusů. Přestože existují rozsáhlé jazykové zdroje pro mnoho jazyků, v praxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešit. Dostupné zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny na základě odlišných lingvistických tradic a konvencí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících syntakticky anotovaných jazykových korpusů.

[ Back to the navigation ] [ Back to the content ]