[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
user:kasner:gauk [2021/10/25 13:15]
kasner [Struktura finančních prostředků - rok 2020:]
user:kasner:gauk [2023/03/05 21:02]
kasner
Line 51: Line 51:
  
 ===== Finanční požadavky ===== ===== Finanční požadavky =====
 +^ Položky ^ Rok 2020 ^ Rok 2021 ^ Rok 2022 ^
 +| Ostatní neinvestiční náklady   | 5/5 | 3/3 | 3 |
 +| Pobytové náklady   | 60/60 | 48/40 | 58 |
 +| Doplňkové náklady  | 23/21 | 19/18 | 21 |
 +| Osobní náklady (mzdy) a stipendia  | 90/80 | 80/80 | 80 |
 +| Celkem | 178/166 | 150/141 | 162 |
  
-==== Struktura finančních prostředků - rok 2020: ==== +==== Struktura finančních prostředků - rok 2022 ==== 
-^ Položky ^ Rok 2020 ^ Rok 2021 ^ +Částky na osobní náklady a stipendia jsou navrženy v souladu s požadavky Grantové agentury UK.
-| Ostatní neinvestiční náklady   | 5/5 | 3/3 | +
-| Pobytové náklady   | 60/60 | 48/40 | +
-| Doplňkové náklady  | 23/21 | 19/18 |  +
-| Osobní náklady (mzdy) a stipendia  | 90/80 | 80/80 | +
-| Celkem | 178/166 | 150/141 |+
  
 +Pobytové náklady by měly umožnit účast a prezentování výsledků na jedné z následujících konferencí:
 +
 +Association for Computational Linguistics Annual Meeting (ACL): 22.-27. květen 2022 / Dublin, Irsko
 +konferenční poplatek: 12 000 Kč
 +cesta: 5 000 Kč
 +stravné: 5 000 Kč
 +ubytování: 7 000 Kč
 +→ celkem: 29 000 Kč
 +
 +International Conference on Natural Language Generation (INLG): 18.-22. červenec 2022 / Maine, USA
 +konferenční poplatek: 10 000 Kč
 +cesta: 30 000 Kč
 +stravné: 5 000 Kč
 +ubytování: 10 000 Kč
 +→ celkem: 55 000 Kč
 +
 +International Conference for Computational Linguistics (COLING): 12.-17. říjen 2022 / Gyeongju, Jižní Korea
 +konferenční poplatek: 12 000 Kč
 +cesta: 30 000 Kč
 +stravné: 6 000 Kč
 +ubytování: 10 000 Kč
 +→ celkem: 58 000 Kč
 +
 +V případě hybridního formátu je možné uvažovat i o online účasti na některé z konferencí. Osobní přítomnost alespoň na jedné významné oborové konferenci ovšem umožní lépe šířit povědomí o práci v průběhu projektu, získat přehled o další výzkumných výsledcích a jednodušeji navázat profesionální kontakty.
 +
 +Ostatní neinvestiční náklady budou použity na nákup odborné literatury a spotřebního materiálu (kancelářských potřeb, tonerů, apod.).
 +
 +==== Struktura finančních prostředků - rok 2021 ====
 +Částky na osobní náklady a stipendia jsou navrženy v souladu s požadavky Grantové agentury UK.
 +
 +Pobytové náklady by měly umožnit účast a prezentování výsledků na jedné z následujících konferencí:
 +
 +Empirical Methods in Natural Language Processing (EMNLP): 7.-11. listopad 2020 / Punta Cana, Dominikánská republika
 +- konferenční poplatek: 11 000 Kč
 +- cesta: 25 000 Kč
 +- stravné: 5 000 Kč
 +- ubytování: 7 000 Kč
 +→ celkem: 48 000 Kč
 +
 +International Conference on Natural Language Generation (INLG): září 2021 (4 dny) / Aberdeen, Velká Británie
 +konferenční poplatek: 7 000 Kč
 +- cesta: 5 000 Kč
 +- stravné: 4 000 Kč
 +- ubytování: 5 000 Kč
 +→ celkem: 21 000 Kč
 +
 +Obě konference se budou konat v druhé polovině tohoto roku, je tedy potřeba počítat s tím, že se mohou konat osobně. Podle aktuálních informací je tato varianta preferována, viz https://2021.emnlp.org a https://aclweb.org/aclwiki/SIGGEN#Upcoming_Events.
 +
 +Ostatní neinvestiční náklady budou použity na nákup odborné literatury a spotřebního materiálu (kancelářských potřeb, tonerů, apod.).
 +
 +==== Struktura finančních prostředků - rok 2020: ====
 Částky na osobní náklady a stipendia jsou navrženy v souladu s požadavky Grantové agentury UK. Částky na osobní náklady a stipendia jsou navrženy v souladu s požadavky Grantové agentury UK.
 Pobytové náklady by měly umožnit účast a prezentování výsledků na jedné z následujících konferencí: Pobytové náklady by měly umožnit účast a prezentování výsledků na jedné z následujících konferencí:
Line 95: Line 147:
  
 ==== Finanční výhled na další roky ==== ==== Finanční výhled na další roky ====
-| Rok 2015 | 180 | +**Rok 2021** | 180 | 
-| Rok 2016 | 180 |+**Rok 2022** | 180 | 
 + 
 + 
 +===== Rozšiřující informace =====
  
 ==== Anotace ==== ==== Anotace ====
Line 302: Line 357:
  
  
-===== Celkové hodnocení projektu ===== +===== Hodnocení projektu - 2021 ===== 
-==== Rok 2021 ====+==== Zpráva o řešení za minulý rok ==== 
 +V minulém roce jsme úspěšně rozpracovali a publikovali prvotní části projektu. 
 + 
 +Pozornost jsme věnovali především technikám pro doménově nezávislé generování přirozeného jazyka. Experimenty s neuronovými modely modely pro editaci textu (Libovický et al., 2020; prezentováno na WNGT 2020) nám umožnily vyvinutí techniky, která využívá model pro syntézu vět (sentence fusion) pro iterativní zlepšování textu vygenerovaného pomocí jednoduchých šablon. Výsledky této práce jsme prezentovali a publikovali na 13th International Conference on Natural Language Generation (INLG 2020; prosinec, online) (Kasner and Dušek, 2020a). 
 + 
 +Předtrénované neuronové modely jsme dále aplikovali na datové sady pro generování jazyka a vytvořili soutěžní systém pro WebNLG Challenge 2020. Tento model je vícejazyčný (angličtina + ruština) a v soutěži se umístil na předních příčkách. Popis systému jsme publikovali a prezentovali na workshopu WebNLG+ (3rd Workshop on Natural Language Generation from the Semantic Web), který se konal během INLG 2020 (Kasner and Dušek, 2020b). 
 + 
 +Podařilo se rozpracovat i vedlejší záměr projektu: vyvinout automatickou metriku pro evaluaci generovaní přirozeného jazyka, která bude lépe korelovat s lidským hodnocením. Za tímto účelem jsme vyvinuli a experimentálně ověřili techniku založenou na předtrénovaném modelu pro inferenci v přirozeném jazyce (Natural Language Inference, NLI). Metrika je plně automatická a na jednoduchých datových sadách dosahuje při hodnocení sémantické přesnosti výsledků lépe korelujících s lidským hodnocením než dosavadní metriky. Práce, publikovaná na INLG 2020, získala ocenění Best Short Paper Award (Dušek and Kasner, 2020). 
 + 
 +Veškeré výsledky práce jsme zároveň prezentovali i na interním semináři Ústavu formální a aplikované lingvistiky (září 2020, online). 
 + 
 +==== Výhled pro další rok ==== 
 +V první části roku dokončíme a zveřejníme pod open-source licencí zdrojový kód a data použitá v části práce zabývající se iterativní syntézou vět. Tento kód umožní navázat na publikovanou práci a do budoucna ji rozšířit. 
 + 
 +Dále se plánujeme zabývat zlepšováním klasických modulů pro generování přirozeného jazyka pomocí moderních technik strojového učení s cílem zlepšit doménovou nezávislost technik, které se v současnosti používají pro generování jazyka v praxi. Kombinace jednotlivých modulů by měla měla zaručit kontrolovatelnější generování jazyka, než současné přístupy pro generování bez mezikroků. 
 + 
 +V oblasti evaluace generování přirozeného jazyka pak plánujeme vytvořit systém pro vyhodnocování přesnosti vygenerovaných výstupů na složitějších datových sadách zahrnující netriviální výběr, agregaci a manipulaci s daty. 
 + 
 +==== Seznam dosažených výsledků ==== 
 +//(přidáváno po položkách i s detaily)// 
 +  * článek ve sborníku - Data-to-Text Generation with Iterative Text Editing 
 +  * článek ve sborníku - Expand and filter: CUNI and LMU systems for the WNGT 2020 Duolingo shared task 
 +  * článek ve sborníku - Evaluating Semantic Accuracy of Data-to-Text Generation with Natural Language Inference 
 +  * článek ve sborníku - Train Hard, Finetune Easy: Multilingual Denoising for RDF-to-Text Generation 
 +  * ostatní - prezentace - ÚFAL seminář 
 + 
 +==== Komentář zpravodaje ====
 **Čerpání finančních prostředků:** Finance byly využity korektně. **Čerpání finančních prostředků:** Finance byly využity korektně.
 **Komentář zpravodaje projektu:** Projekt přinesl hned v prvním roce několik publikací prezentovaných na mezinárodních konferencích, a jedna z nich získala ocenění Best Short Paper Award. **Komentář zpravodaje projektu:** Projekt přinesl hned v prvním roce několik publikací prezentovaných na mezinárodních konferencích, a jedna z nich získala ocenění Best Short Paper Award.
 Pokud cestovní prostředky nebudou ve druhém a třetím roce využitelné vzhledem k cestovním omezením, doporučuji je jako nespotřebované vrátit. Pokud cestovní prostředky nebudou ve druhém a třetím roce využitelné vzhledem k cestovním omezením, doporučuji je jako nespotřebované vrátit.
  
-==== Rok 2020 ====+===== Hodnocení projektu - 2020 =====
 * **Shrnutí zpravodaje:** Mimořádně kvalitní projekt. Na základě oponentských posudků předložený projekt * **Shrnutí zpravodaje:** Mimořádně kvalitní projekt. Na základě oponentských posudků předložený projekt
 doporučuji k financování. Oba dva oponenti shodně hodnotili projekt jako vynikající. V textu posudků oponenti doporučuji k financování. Oba dva oponenti shodně hodnotili projekt jako vynikající. V textu posudků oponenti

[ Back to the navigation ] [ Back to the content ]