[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/12 22:59]
rosa
user:rosa:gauk [2013/11/13 00:49]
rosa
Line 6: Line 6:
 ===== Základní informace o projektu č. 1572314 ===== ===== Základní informace o projektu č. 1572314 =====
 **Tady se akorát možná vymyslí lepší název?** **Tady se akorát možná vymyslí lepší název?**
-Český název projektu: HamleDT: Kolekce harmonizovaných závislostních treebanků pro mnoho jazyků +Český název projektu: Modelování závislostní syntaxe napříč jazyky 
-Anglický název projektu: HamleDT: Collection of harmonized dependency treebanks for many languages+Anglický název projektu: Modelling of dependency syntax across languages
 Aktuální řešitel: Mgr. Rudolf Rosa Aktuální řešitel: Mgr. Rudolf Rosa
 První žadatel: Rudolf Rosa První žadatel: Rudolf Rosa
Line 81: Line 81:
  
 ==== Anotace (max 200 slov): ==== ==== Anotace (max 200 slov): ====
- 
 // //
-Lze edpokládat, že lidské jazyky jsou si navzájem více či méně podobnéa žznalost jednoho jazyka lze využít pro snazší porozumění jinému jazyku. Doklady toho vidíme běžně kolem sebekdyž pozorujemeže lidé jsou schopni malou nebo žádnou dopomocí porozumět neznámému jazykukterý je podobný jazyku jim známému; a že každý další jazyk se učí snáze, pokud není blízce příbuzný s žádným jim známým jazykem.+V grantovém projektu budeme zkoumat vzájemné podobnosti irozených jazyků a získané poznatky využijeme pro dva typy úloh komputační lingvistikyřešících aktuální problémy zpracování jazyka na úrovni syntaxe. 
 +Prvním typem úloh budou technologie mezijazyčné projekce, kdy model jednoho jazyka využijeme pro přibližné modelování jazyka podobnéhopro který nemáme dostatečné jazykové zdroje. 
 +Druhým typem úloh bude přenositelnost jednojazyčných technologiíkdy nástroje a postupy vyvinuté pro práci jedním či několika málo jazyky zobecníme takaby umožňovaly zpracování téměř či zcela libovolného jazyka, pro který jsou k dipozici odpovídající datové zdroje.
  
-V tomto projektu tuto vlastnost jazyků využijeme v počítačovém zpracování přirozených jazyků, a to pro dva typy úloh odpovídající těmto dvěma pozorováním. +Přestože existují rozsáhlé jazykové zdroje pro mnoho jazykůpraxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešit. Dostupné zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny na základě odlišných lingvistických tradic a konvencí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících syntakticky anotovaných jazykových korpusů.
-Prvním typem jsou technologie crosslingvální projekce, kdy schopnost zpracovávat jeden jazyk bychom měli být schopni využít pro zpracování jazyka podobného, pro který nemáme dostatečné jazykové zdroje+
-Druhým typem je přenositelnost monolingválních technologiíkdy nástroje a postupy vyvinuté pro práci s jedním jazykem by mělo být snadné upravit pro práci s jiným jazykem. +
- +
-praxi se bohužel často ukazuje, že je obtížné toto uskutečnit, přestožjiž existují rozsáhlé jazykové zdroje pro mnoho jazyků, neboť tyto zdroje jsou obvykle silně heterogenní, používají různá anotační schémata a jsou vystavěny dle odlišných lingvistických rozhodnutí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících jazykových zdrojů; konkrétně se zaměříme na syntakticky anotované korpusy.+
 // //
- 
- 
- 
- 
-Všechny lidské jazyky jsou si více či méně podobné. Víme, že lidé, kteří již znají jeden cizí jazyk, se druhý cizí jazyk učí snáze, i když je typologicky odlišný - během učení se prvního jazyka se tedy naučí i nějaké univerzálnější dovednosti, které poté dovedou využít pro snadnější naučení druhému jazyku. Také víme, že lidé, kteří mluví francouzsky, dokážou alespoň omezeně porozumět italštině - je tedy možné znalost jendoho jazyka použít pro omezené porozumění podobnému jazyku. 
  
 ==== Anotace v anglickém jazyce (max 200 slov): ==== ==== Anotace v anglickém jazyce (max 200 slov): ====
Line 182: Line 174:
 ==== Prezentace výsledků: ==== ==== Prezentace výsledků: ====
 //Výsledky budou průběžně prezentovány na seminářích Ústavu formální a aplikované lingvistiky a na WDS. //Výsledky budou průběžně prezentovány na seminářích Ústavu formální a aplikované lingvistiky a na WDS.
-Budeme také publikovat příspěvky na mezinárodních konferencích -- plánujeme účast na +Budeme publikovat příspěvky na mezinárodních konferencích -- pokusíme se o přijetí článku na 
-konferencích LREC, ACL, a/nebo TLT. +konferenci LREC, ACL, a/nebo TLT -- a plánujeme i publikaci v odborném časopise, například PBML
-Plus se budem snažit o časopisy+Průběžné výsledky budeme popisovat také v technických zprávách
-A taky budem publikovat software, kterej z toho vznikne, s otevřenejma licencema+Vytvořený software bude průběžně zveřejňován na webových stránkách pod svobodnou licencí. 
-U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány + 
-Grantovou agenturou Univerzity Karlovy.//+U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány Grantovou agenturou Univerzity Karlovy.//
  
 ===== Přílohy ===== ===== Přílohy =====
 Moje CV a publikace ([[http://cv.nikde.eu/rosa_rudolf_cv_cs.php]]), Moje CV a publikace ([[http://cv.nikde.eu/rosa_rudolf_cv_cs.php]]),
 ZŽ CV, ZŽ publikace, HM CV. ZŽ CV, ZŽ publikace, HM CV.

[ Back to the navigation ] [ Back to the content ]