[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/12 23:07]
rosa
user:rosa:gauk [2013/11/13 00:25]
rosa
Line 6: Line 6:
 ===== Základní informace o projektu č. 1572314 ===== ===== Základní informace o projektu č. 1572314 =====
 **Tady se akorát možná vymyslí lepší název?** **Tady se akorát možná vymyslí lepší název?**
-Český název projektu: HamleDT: Kolekce harmonizovaných závislostních treebanků pro mnoho jazyků +Český název projektu: Modelování závislostní syntaxe napříč jazyky 
-Anglický název projektu: HamleDT: Collection of harmonized dependency treebanks for many languages+Anglický název projektu: Modelling of dependency syntax across languages
 Aktuální řešitel: Mgr. Rudolf Rosa Aktuální řešitel: Mgr. Rudolf Rosa
 První žadatel: Rudolf Rosa První žadatel: Rudolf Rosa
Line 81: Line 81:
  
 ==== Anotace (max 200 slov): ==== ==== Anotace (max 200 slov): ====
- 
 // //
-Lidské jazyky jsou si navzájem více či méně podobné, a znalost jednoho jazyka můžeme využít pro snazší porozumění jinému jazykuDoklady toho můžeme pozorovat sami na sobě -- jsme schopni s malou nebo žádnou dopomocí porozumět neznámému jazyku, který je podobný jazyku nám již známému; a čím více cizích jazyků známe, tím snáze se nám učí každý další cizí jazyk, i pokud není blízce íbuzný s žádným nám známým jazykem.+V grantovém projektu budeme zkoumat vzájemné podobnosti přirozených jazyků, a získané poznatky využijeme pro dva typy úloh komputační lingvistiky, řešících aktuální problémy zpracování jazyka na úrovni syntaxe. 
 +Prvním typem úloh budou technologie mezijazyčné projekce, kdy model jednoho jazyka využijeme pro přibližné zpracování jazyka podobnéhopro který nemáme dostatečné jazykové zdroje. 
 +Druhým typem bude enositelnost jednojazyčných technologií, kdy zobecníme některé nástroje a postupy vyvinuté pro práci jedním či několika málo jazyky, tak aby umožňovaly zpracování téměř libovolného jazyka, pro který existují odpovídající datové zdroje.
  
-V tomto projektu tyto vlastnosti jazyků využijeme v počítačovém zpracování přirozených jazyků, a to pro dva typy úloh: +Přestože existují rozsáhlé jazykové zdroje pro mnoho jazykůpraxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešitDostupné zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny na základě odlišných lingvistických tradic a konvencí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících syntakticky anotovaných jazykových korpusů.
-Prvním typem jsou technologie crosslingvální projekce, kdy schopnost zpracovávat jeden jazyk využijeme pro zpracování jazyka podobného, pro který nemáme dostatečné jazykové zdroje+
-Druhým typem je přenositelnost monolingválních technologiíkdy nástroje a postupy vyvinuté pro práci s jedním jazykem adaptujeme pro práci s jinými jazyky. +
- +
-praxi se bohužel často ukazuje, že je obtížné toto uskutečnit, přestožjsou již dostupné rozsáhlé jazykové zdroje pro mnoho jazykůTyto zdroje jsou totiž obvykle silně heterogenní, používají různá anotační schémata a jsou vystavěny dle odlišných lingvistických rozhodnutí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících jazykových zdrojů; konkrétně se zaměříme na syntakticky anotované korpusy.+
 // //
- 
- 
- 
- 
-Všechny lidské jazyky jsou si více či méně podobné. Víme, že lidé, kteří již znají jeden cizí jazyk, se druhý cizí jazyk učí snáze, i když je typologicky odlišný - během učení se prvního jazyka se tedy naučí i nějaké univerzálnější dovednosti, které poté dovedou využít pro snadnější naučení druhému jazyku. Také víme, že lidé, kteří mluví francouzsky, dokážou alespoň omezeně porozumět italštině - je tedy možné znalost jendoho jazyka použít pro omezené porozumění podobnému jazyku. 
  
 ==== Anotace v anglickém jazyce (max 200 slov): ==== ==== Anotace v anglickém jazyce (max 200 slov): ====

[ Back to the navigation ] [ Back to the content ]