[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:rosa:gauk [2013/11/12 19:11]
rosa
user:rosa:gauk [2013/11/13 00:26]
rosa
Line 6: Line 6:
 ===== Základní informace o projektu č. 1572314 ===== ===== Základní informace o projektu č. 1572314 =====
 **Tady se akorát možná vymyslí lepší název?** **Tady se akorát možná vymyslí lepší název?**
-Český název projektu: HamleDT: Kolekce harmonizovaných závislostních treebanků pro mnoho jazyků +Český název projektu: Modelování závislostní syntaxe napříč jazyky 
-Anglický název projektu: HamleDT: Collection of harmonized dependency treebanks for many languages+Anglický název projektu: Modelling of dependency syntax across languages
 Aktuální řešitel: Mgr. Rudolf Rosa Aktuální řešitel: Mgr. Rudolf Rosa
 První žadatel: Rudolf Rosa První žadatel: Rudolf Rosa
Line 50: Line 50:
 Položky Rok 2014 Položky Rok 2014
 Ostatní neinvestiční náklady 10 Ostatní neinvestiční náklady 10
-Cestovné 93+Cestovné 90
 Doplňkové náklady (počítá se automaticky) Doplňkové náklady (počítá se automaticky)
 Osobní náklady (mzdy) a stipendia (počítá se automaticky) Osobní náklady (mzdy) a stipendia (počítá se automaticky)
Line 81: Line 81:
  
 ==== Anotace (max 200 slov): ==== ==== Anotace (max 200 slov): ====
-**Tohle chce doladitvlastně asi úplně napsat znova...**+// 
 +V grantovém projektu budeme zkoumat vzájemné podobnosti přirozených jazykůa získané poznatky využijeme pro dva typy úloh komputační lingvistiky, řešících aktuální problémy zpracování jazyka na úrovni syntaxe. 
 +Prvním typem úloh budou technologie mezijazyčné projekce, kdy model jednoho jazyka využijeme pro přibližné modelování jazyka podobného, pro který nemáme dostatečné jazykové zdroje. 
 +Druhým typem bude přenositelnost jednojazyčných technologií, kdy zobecníme některé nástroje a postupy vyvinuté pro práci s jedním či několika málo jazyky, tak aby umožňovaly zpracování téměř či zcela libovolného jazyka, pro který jsou k dipozici odpovídající datové zdroje.
  
 +Přestože existují rozsáhlé jazykové zdroje pro mnoho jazyků, v praxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešit. Dostupné zdroje jsou totiž obvykle silně heterogenní, používají rozdílná anotační schémata a jsou vystavěny na základě odlišných lingvistických tradic a konvencí. Nutným mezikrokem pro uskutečnění hlavních cílů projektu je proto shromáždění a harmonizace existujících syntakticky anotovaných jazykových korpusů.
 // //
-Projekt bude zkoumat přenositelnost jazykových formalismů a technologií napříč různými jazyky, včetně vlivu použitých formalismů na úspěšnost technologií, které je využivají. 
-Za tím účelem bude vytvořena mnohajazyčná sada treebanků HamleDT 2.0, která bude vylepšením a rozšířením projektu HamleDT 1.0, sdružujícím existující treebanky do jednotného formátu. 
-Bude navržena sada testů, které umožní nalézt nedostatky v existujících konverzních blocích a tyto nedostatky budou opraveny. Dále bude konverze rozšířena o harmonizaci anotace lingvistických jevů, které jsou ve zdrojových treebancích zachyceny heterogenně (HamleDT 1.0 řeší prakticky jen koordinace, že), a bude navržena jazykově univerzální sada značek pro závislostní vztahy. 
-Důraz bude kladen na co nejvyšší možnou jazykovou nezávislost všech vytvořených nástrojů. 
-// 
- 
- 
-Vylepšení harmonizace treebanků - teď se neřeší spousta věcí a má to spousty chyb. 
-Přidání nových treebanků. 
-Testování konzistentnosti harmonizovaných treebanků, na to navázané další vylepšování harmonizace. 
-Zkoumání přenositelnosti znalostí a technologií mezi jazykama, zjišťování co je jazykově specifické a co je více či méně "univerzální". Cross-linguální a multilinguální experimenty, např. delexikalizovaný parsing nebo joint parsing. 
  
 ==== Anotace v anglickém jazyce (max 200 slov): ==== ==== Anotace v anglickém jazyce (max 200 slov): ====
Line 183: Line 176:
 Budeme také publikovat příspěvky na mezinárodních konferencích -- plánujeme účast na Budeme také publikovat příspěvky na mezinárodních konferencích -- plánujeme účast na
 konferencích LREC, ACL, a/nebo TLT. konferencích LREC, ACL, a/nebo TLT.
 +Plus se budem snažit o časopisy.
 +A taky budem publikovat software, kterej z toho vznikne, s otevřenejma licencema.
 U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány
 Grantovou agenturou Univerzity Karlovy.// Grantovou agenturou Univerzity Karlovy.//

[ Back to the navigation ] [ Back to the content ]