Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
user:rosa:gauk [2013/11/12 23:18] rosa |
user:rosa:gauk [2013/11/12 23:51] rosa |
| |
==== Anotace (max 200 slov): ==== | ==== Anotace (max 200 slov): ==== |
| |
// | // |
Lidské jazyky jsou si navzájem více či méně podobné, a znalost jednoho jazyka můžeme využít pro snazší porozumění jinému jazyku. Doklady toho můžeme pozorovat sami na sobě -- jsme schopni s malou nebo žádnou dopomocí porozumět neznámému jazyku, který je podobný jazyku nám již známému; a čím více cizích jazyků známe, tím snáze se nám učí každý další cizí jazyk, i pokud není blízce příbuzný s žádným nám známým jazykem. | V grantovém projektu budeme zkoumat vzájemné similarity [podobnosti?] přirozených jazyků, a získané poznatky využijeme pro dva typy úloh komputační lingvistiky, řešících aktuální problémy zpracování jazyka. |
| Prvním typem úloh budou technologie crosslingvální [mezijazyčné?] projekce, kdy schopnost zpracovávat jeden jazyk využijeme pro zpracování jazyka podobného, pro který nemáme dostatečné jazykové zdroje. |
V tomto projektu tyto vlastnosti jazyků využijeme v počítačovém zpracování přirozených jazyků, a to pro dva typy úloh: | Druhým typem bude přenositelnost monolingválních [jednojazyčných?] technologií, kdy nástroje a postupy vyvinuté pro práci s jedním jazykem adaptujeme pro práci s jinými jazyky. |
Prvním typem jsou technologie crosslingvální projekce, kdy schopnost zpracovávat jeden jazyk využijeme pro zpracování jazyka podobného, pro který nemáme dostatečné jazykové zdroje. | |
Druhým typem je přenositelnost monolingválních technologií, kdy nástroje a postupy vyvinuté pro práci s jedním jazykem adaptujeme pro práci s jinými jazyky. | |
| |
Přestože jsou dostupné rozsáhlé jazykové zdroje pro mnoho jazyků, v praxi se často ukazuje, že je obtížné toto uskutečnit. Tyto zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny dle odlišných lingvistických rozhodnutí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících jazykových zdrojů; konkrétně se zaměříme na syntakticky anotované korpusy. | Přestože existují rozsáhlé jazykové zdroje pro mnoho jazyků, v praxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešit. Dostupné zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny na základě odlišných lingvistických rozhodnutí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících jazykových zdrojů, zejména syntakticky anotovaných korpusů. |
// | // |
| |