[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/12 23:06]
rosa
user:rosa:gauk [2013/11/13 00:49]
rosa
Line 6: Line 6:
 ===== Základní informace o projektu č. 1572314 ===== ===== Základní informace o projektu č. 1572314 =====
 **Tady se akorát možná vymyslí lepší název?** **Tady se akorát možná vymyslí lepší název?**
-Český název projektu: HamleDT: Kolekce harmonizovaných závislostních treebanků pro mnoho jazyků +Český název projektu: Modelování závislostní syntaxe napříč jazyky 
-Anglický název projektu: HamleDT: Collection of harmonized dependency treebanks for many languages+Anglický název projektu: Modelling of dependency syntax across languages
 Aktuální řešitel: Mgr. Rudolf Rosa Aktuální řešitel: Mgr. Rudolf Rosa
 První žadatel: Rudolf Rosa První žadatel: Rudolf Rosa
Line 81: Line 81:
  
 ==== Anotace (max 200 slov): ==== ==== Anotace (max 200 slov): ====
- 
 // //
-Lidské jazyky jsou si navzájem více či méně podobnéa znalost jednoho jazyka můžeme využít pro snazší porozumění jinému jazyku. Doklady toho můžeme pozorovat sami na sobě -- jsme schopni s malou nebo žádnou dopomocí porozumět neznámému jazyku, který je podobný jazyku nám již známému; a čím více cizích jazyků známe, tím snáze se nám učí každý další cizí jazyk, i pokud není blízce íbuzný s žádným nám známým jazykem.+V grantovém projektu budeme zkoumat vzájemné podobnosti přirozených jazyků a získané poznatky využijeme pro dva typy úloh komputační lingvistikyřešících aktuální problémy zpracování jazyka na úrovni syntaxe. 
 +Prvním typem úloh budou technologie mezijazyčné projekce, kdy model jednoho jazyka využijeme pro přibližné modelování jazyka podobnéhopro který nemáme dostatečné jazykové zdroje. 
 +Druhým typem úloh bude enositelnost jednojazyčných technologií, kdy nástroje a postupy vyvinuté pro práci jedním či několika málo jazyky zobecníme tak, aby umožňovaly zpracování téměř či zcela libovolného jazyka, pro který jsou k dipozici odpovídající datové zdroje.
  
-V tomto projektu tyto vlastnosti jazyků využijeme v počítačovém zpracování přirozených jazyků, a to pro dva typy úloh: +Přestože existují rozsáhlé jazykové zdroje pro mnoho jazykůpraxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešitDostupné zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny na základě odlišných lingvistických tradic a konvencí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících syntakticky anotovaných jazykových korpusů.
-Prvním typem jsou technologie crosslingvální projekce, kdy schopnost zpracovávat jeden jazyk bychom měli být schopni využít pro zpracování jazyka podobného, pro který nemáme dostatečné jazykové zdroje+
-Druhým typem je přenositelnost monolingválních technologiíkdy nástroje a postupy vyvinuté pro práci s jedním jazykem by mělo být snadné adaptovat pro práci s jiným jazykem. +
- +
-praxi se bohužel často ukazuje, že je obtížné toto uskutečnit, přestožjsou již dostupné rozsáhlé jazykové zdroje pro mnoho jazykůTyto zdroje jsou totiž obvykle silně heterogenní, používají různá anotační schémata a jsou vystavěny dle odlišných lingvistických rozhodnutí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících jazykových zdrojů; konkrétně se zaměříme na syntakticky anotované korpusy.+
 // //
- 
- 
- 
- 
-Všechny lidské jazyky jsou si více či méně podobné. Víme, že lidé, kteří již znají jeden cizí jazyk, se druhý cizí jazyk učí snáze, i když je typologicky odlišný - během učení se prvního jazyka se tedy naučí i nějaké univerzálnější dovednosti, které poté dovedou využít pro snadnější naučení druhému jazyku. Také víme, že lidé, kteří mluví francouzsky, dokážou alespoň omezeně porozumět italštině - je tedy možné znalost jendoho jazyka použít pro omezené porozumění podobnému jazyku. 
  
 ==== Anotace v anglickém jazyce (max 200 slov): ==== ==== Anotace v anglickém jazyce (max 200 slov): ====
Line 182: Line 174:
 ==== Prezentace výsledků: ==== ==== Prezentace výsledků: ====
 //Výsledky budou průběžně prezentovány na seminářích Ústavu formální a aplikované lingvistiky a na WDS. //Výsledky budou průběžně prezentovány na seminářích Ústavu formální a aplikované lingvistiky a na WDS.
-Budeme také publikovat příspěvky na mezinárodních konferencích -- plánujeme účast na +Budeme publikovat příspěvky na mezinárodních konferencích -- pokusíme se o přijetí článku na 
-konferencích LREC, ACL, a/nebo TLT. +konferenci LREC, ACL, a/nebo TLT -- a plánujeme i publikaci v odborném časopise, například PBML
-Plus se budem snažit o časopisy+Průběžné výsledky budeme popisovat také v technických zprávách
-A taky budem publikovat software, kterej z toho vznikne, s otevřenejma licencema+Vytvořený software bude průběžně zveřejňován na webových stránkách pod svobodnou licencí. 
-U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány + 
-Grantovou agenturou Univerzity Karlovy.//+U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány Grantovou agenturou Univerzity Karlovy.//
  
 ===== Přílohy ===== ===== Přílohy =====
 Moje CV a publikace ([[http://cv.nikde.eu/rosa_rudolf_cv_cs.php]]), Moje CV a publikace ([[http://cv.nikde.eu/rosa_rudolf_cv_cs.php]]),
 ZŽ CV, ZŽ publikace, HM CV. ZŽ CV, ZŽ publikace, HM CV.

[ Back to the navigation ] [ Back to the content ]