Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:rosa:gauk [2013/11/12 03:24] rosa |
user:rosa:gauk [2013/11/12 23:51] rosa |
||
---|---|---|---|
Line 6: | Line 6: | ||
===== Základní informace o projektu č. 1572314 ===== | ===== Základní informace o projektu č. 1572314 ===== | ||
**Tady se akorát možná vymyslí lepší název?** | **Tady se akorát možná vymyslí lepší název?** | ||
- | Český název projektu: HamleDT: Kolekce harmonizovaných závislostních treebanků pro mnoho jazyků | + | Český název projektu: Odhalování a vytěžování multilingválních similarit |
- | Anglický název projektu: HamleDT: Collection | + | Anglický název projektu: Discovery and exploitation |
Aktuální řešitel: Mgr. Rudolf Rosa | Aktuální řešitel: Mgr. Rudolf Rosa | ||
První žadatel: Rudolf Rosa | První žadatel: Rudolf Rosa | ||
Line 50: | Line 50: | ||
Položky Rok 2014 | Položky Rok 2014 | ||
Ostatní neinvestiční náklady 10 | Ostatní neinvestiční náklady 10 | ||
- | Cestovné 93 | + | Cestovné 90 |
Doplňkové náklady (počítá se automaticky) | Doplňkové náklady (počítá se automaticky) | ||
Osobní náklady (mzdy) a stipendia (počítá se automaticky) | Osobní náklady (mzdy) a stipendia (počítá se automaticky) | ||
Line 62: | Line 62: | ||
Plánované konference a pobyty: | Plánované konference a pobyty: | ||
* LREC 2014, Rejkjavík (poplatek 8000 Kč, ubytování a doprava 35000 Kč) | * LREC 2014, Rejkjavík (poplatek 8000 Kč, ubytování a doprava 35000 Kč) | ||
- | * ACL 2014, Baltimore (poplatek 15000 Kč, ubytování a doprava | + | * ACL 2014, Baltimore (poplatek 15000 Kč, ubytování a doprava |
- | * TLT 2014 (poplatek 3500 Kč, ubytování a doprava | + | * TLT 2014 (poplatek 3500 Kč, ubytování a doprava |
Náklady na pobyty jsou určeny přibližně na základě minulých let. | Náklady na pobyty jsou určeny přibližně na základě minulých let. | ||
Line 69: | Line 69: | ||
Neinvest náklady: | Neinvest náklady: | ||
- | Mam tam harddisky (viz materiální todleto). | + | Mam tam harddisky (viz materiální todleto). Požádal jsem Milana o nějakej cenovej odhad, zatim ho nemam. |
Kancelářský potřeby se tam prej psát nemaj. | Kancelářský potřeby se tam prej psát nemaj. | ||
Literaturu nevim jestli nějakou chcem kupovat. | Literaturu nevim jestli nějakou chcem kupovat. | ||
Line 81: | Line 81: | ||
==== Anotace (max 200 slov): ==== | ==== Anotace (max 200 slov): ==== | ||
- | **Tohle chce doladit, vlastně asi úplně napsat znova...** | + | // |
+ | V grantovém projektu budeme zkoumat vzájemné similarity [podobnosti? | ||
+ | Prvním typem úloh budou technologie crosslingvální [mezijazyčné? | ||
+ | Druhým typem bude přenositelnost monolingválních [jednojazyčných? | ||
+ | Přestože existují rozsáhlé jazykové zdroje pro mnoho jazyků, v praxi se často ukazuje, že je obtížné tyto úlohy úspěšně řešit. Dostupné zdroje jsou totiž obvykle silně heterogenní, | ||
// | // | ||
- | Projekt bude zkoumat přenositelnost jazykových formalismů a technologií napříč různými jazyky, včetně vlivu použitých formalismů na úspěšnost technologií, | ||
- | Za tím účelem bude vytvořena mnohajazyčná sada treebanků HamleDT 2.0, která bude vylepšením a rozšířením projektu HamleDT 1.0, sdružujícím existující treebanky do jednotného formátu. | ||
- | Bude navržena sada testů, které umožní nalézt nedostatky v existujících konverzních blocích a tyto nedostatky budou opraveny. Dále bude konverze rozšířena o harmonizaci anotace lingvistických jevů, které jsou ve zdrojových treebancích zachyceny heterogenně (HamleDT 1.0 řeší prakticky jen koordinace, že), a bude navržena jazykově univerzální sada značek pro závislostní vztahy. | ||
- | Důraz bude kladen na co nejvyšší možnou jazykovou nezávislost všech vytvořených nástrojů. | ||
- | // | ||
- | |||
- | |||
- | Vylepšení harmonizace treebanků - teď se neřeší spousta věcí a má to spousty chyb. | ||
- | Přidání nových treebanků. | ||
- | Testování konzistentnosti harmonizovaných treebanků, na to navázané další vylepšování harmonizace. | ||
- | Zkoumání přenositelnosti znalostí a technologií mezi jazykama, zjišťování co je jazykově specifické a co je více či méně " | ||
==== Anotace v anglickém jazyce (max 200 slov): ==== | ==== Anotace v anglickém jazyce (max 200 slov): ==== | ||
Line 183: | Line 176: | ||
Budeme také publikovat příspěvky na mezinárodních konferencích -- plánujeme účast na | Budeme také publikovat příspěvky na mezinárodních konferencích -- plánujeme účast na | ||
konferencích LREC, ACL, a/nebo TLT. | konferencích LREC, ACL, a/nebo TLT. | ||
+ | Plus se budem snažit o časopisy. | ||
+ | A taky budem publikovat software, kterej z toho vznikne, s otevřenejma licencema. | ||
U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány | U všech publikací, včetně disertační práce, bude uvedeno, že byly finančně podporovány | ||
Grantovou agenturou Univerzity Karlovy.// | Grantovou agenturou Univerzity Karlovy.// |