Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:kasner:gauk [2021/10/25 12:47] kasner [Přílohy] |
user:kasner:gauk [2021/10/25 13:22] kasner |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ===== GAUK – Zdeněk Kasner ===== | + | {{ : |
Žádost o GAUK pro téma mojí disertační práce, volně k využití jako inspirace při psaní vlastních žádostí. | Žádost o GAUK pro téma mojí disertační práce, volně k využití jako inspirace při psaní vlastních žádostí. | ||
Line 51: | Line 51: | ||
===== Finanční požadavky ===== | ===== Finanční požadavky ===== | ||
+ | ^ Položky ^ Rok 2020 ^ Rok 2021 ^ | ||
+ | | Ostatní neinvestiční náklady | ||
+ | | Pobytové náklady | ||
+ | | Doplňkové náklady | ||
+ | | Osobní náklady (mzdy) a stipendia | ||
+ | | Celkem | 178/166 | 150/141 | | ||
- | ==== Struktura finančních prostředků - rok 2020: ==== | + | ==== Struktura finančních prostředků - rok 2021 ==== |
- | ^ Položky ^ Rok 2020 ^ | + | Částky na osobní |
- | | Ostatní neinvestiční | + | |
- | | Pobytové náklady | + | |
- | | Doplňkové náklady | + | |
- | | Osobní náklady (mzdy) | + | |
- | | Celkem | 178/166 | | + | |
+ | Pobytové náklady by měly umožnit účast a prezentování výsledků na jedné z následujících konferencí: | ||
+ | |||
+ | Empirical Methods in Natural Language Processing (EMNLP): 7.-11. listopad 2020 / Punta Cana, Dominikánská republika | ||
+ | - konferenční poplatek: 11 000 Kč | ||
+ | - cesta: 25 000 Kč | ||
+ | - stravné: 5 000 Kč | ||
+ | - ubytování: | ||
+ | → celkem: 48 000 Kč | ||
+ | |||
+ | International Conference on Natural Language Generation (INLG): září 2021 (4 dny) / Aberdeen, Velká Británie | ||
+ | konferenční poplatek: 7 000 Kč | ||
+ | - cesta: 5 000 Kč | ||
+ | - stravné: 4 000 Kč | ||
+ | - ubytování: | ||
+ | → celkem: 21 000 Kč | ||
+ | |||
+ | Obě konference se budou konat v druhé polovině tohoto roku, je tedy potřeba počítat s tím, že se mohou konat osobně. Podle aktuálních informací je tato varianta preferována, | ||
+ | |||
+ | Ostatní neinvestiční náklady budou použity na nákup odborné literatury a spotřebního materiálu (kancelářských potřeb, tonerů, apod.). | ||
+ | |||
+ | ==== Struktura finančních prostředků - rok 2020: ==== | ||
Částky na osobní náklady a stipendia jsou navrženy v souladu s požadavky Grantové agentury UK. | Částky na osobní náklady a stipendia jsou navrženy v souladu s požadavky Grantové agentury UK. | ||
Pobytové náklady by měly umožnit účast a prezentování výsledků na jedné z následujících konferencí: | Pobytové náklady by měly umožnit účast a prezentování výsledků na jedné z následujících konferencí: | ||
Line 95: | Line 117: | ||
==== Finanční výhled na další roky ==== | ==== Finanční výhled na další roky ==== | ||
- | | Rok 2015 | 180 | | + | | **Rok 2021** |
- | | Rok 2016 | 180 | | + | | **Rok 2022** |
+ | |||
+ | |||
+ | ===== Rozšiřující informace ===== | ||
==== Anotace ==== | ==== Anotace ==== | ||
Line 302: | Line 327: | ||
- | ===== Celkové | + | ===== Hodnocení projektu - 2021 ===== |
- | * Shrnutí zpravodaje: Mimořádně kvalitní projekt. Na základě oponentských posudků předložený projekt | + | ==== Zpráva o řešení za minulý rok ==== |
+ | V minulém roce jsme úspěšně rozpracovali a publikovali prvotní části projektu. | ||
+ | |||
+ | Pozornost jsme věnovali především technikám pro doménově nezávislé generování přirozeného jazyka. Experimenty s neuronovými modely modely pro editaci textu (Libovický et al., 2020; prezentováno na WNGT 2020) nám umožnily vyvinutí techniky, která využívá model pro syntézu vět (sentence fusion) pro iterativní zlepšování textu vygenerovaného pomocí jednoduchých šablon. Výsledky této práce jsme prezentovali a publikovali na 13th International Conference on Natural Language Generation (INLG 2020; prosinec, online) (Kasner and Dušek, 2020a). | ||
+ | |||
+ | Předtrénované neuronové modely jsme dále aplikovali na datové sady pro generování jazyka a vytvořili soutěžní systém pro WebNLG Challenge 2020. Tento model je vícejazyčný (angličtina + ruština) a v soutěži se umístil na předních příčkách. Popis systému jsme publikovali a prezentovali na workshopu WebNLG+ (3rd Workshop on Natural Language Generation from the Semantic Web), který se konal během INLG 2020 (Kasner and Dušek, 2020b). | ||
+ | |||
+ | Podařilo se rozpracovat i vedlejší záměr projektu: vyvinout automatickou metriku pro evaluaci generovaní přirozeného jazyka, která bude lépe korelovat s lidským hodnocením. Za tímto účelem jsme vyvinuli a experimentálně ověřili techniku založenou na předtrénovaném modelu pro inferenci v přirozeném jazyce (Natural Language Inference, NLI). Metrika je plně automatická a na jednoduchých datových sadách dosahuje při hodnocení | ||
+ | |||
+ | Veškeré výsledky práce jsme zároveň prezentovali i na interním semináři Ústavu formální a aplikované lingvistiky (září 2020, online). | ||
+ | |||
+ | ==== Výhled pro další rok ==== | ||
+ | V první části roku dokončíme a zveřejníme pod open-source licencí zdrojový kód a data použitá v části práce zabývající se iterativní syntézou vět. Tento kód umožní navázat na publikovanou práci a do budoucna ji rozšířit. | ||
+ | |||
+ | Dále se plánujeme zabývat zlepšováním klasických modulů pro generování přirozeného jazyka pomocí moderních technik strojového učení s cílem zlepšit doménovou nezávislost technik, které se v současnosti používají pro generování jazyka v praxi. Kombinace jednotlivých modulů by měla měla zaručit kontrolovatelnější generování jazyka, než současné přístupy pro generování bez mezikroků. | ||
+ | |||
+ | V oblasti evaluace generování přirozeného jazyka pak plánujeme vytvořit systém pro vyhodnocování přesnosti vygenerovaných výstupů na složitějších datových sadách zahrnující netriviální výběr, agregaci a manipulaci s daty. | ||
+ | |||
+ | |||
+ | ==== Komentář zpravodaje ==== | ||
+ | **Čerpání finančních prostředků: | ||
+ | **Komentář zpravodaje | ||
+ | Pokud cestovní prostředky nebudou ve druhém a třetím roce využitelné vzhledem k cestovním omezením, doporučuji je jako nespotřebované vrátit. | ||
+ | |||
+ | ==== Rok 2020 ==== | ||
+ | * **Shrnutí zpravodaje:** Mimořádně kvalitní projekt. Na základě oponentských posudků předložený projekt | ||
doporučuji k financování. Oba dva oponenti shodně hodnotili projekt jako vynikající. V textu posudků oponenti | doporučuji k financování. Oba dva oponenti shodně hodnotili projekt jako vynikající. V textu posudků oponenti | ||
nezávisle vyzvedli tytéž kvality řešitele a jeho týmu. Ani jeden z oponentů nezmiňuje žádné podstatné slabší | nezávisle vyzvedli tytéž kvality řešitele a jeho týmu. Ani jeden z oponentů nezmiňuje žádné podstatné slabší | ||
Line 309: | Line 359: | ||
poznatky prezentovat. Skladba řešitelského kolektivu je adekvátní. Souhlasím i s výší odměn za zdárné vedení | poznatky prezentovat. Skladba řešitelského kolektivu je adekvátní. Souhlasím i s výší odměn za zdárné vedení | ||
projektu. | projektu. | ||
- | * Celkové hodnocení projektu ve srovnání s ostatními projekty zpravodaje: nadprůměrný | + | * **Celkové hodnocení projektu ve srovnání s ostatními projekty zpravodaje:** nadprůměrný |
- | * Doporučení při novém podání: Podat znovu, jedná se o kvalitní projekt | + | * **Doporučení při novém podání:** Podat znovu, jedná se o kvalitní projekt |
- | * Celkové umístění projektu v rámci sekce: v 1. třetině | + | * **Celkové umístění projektu v rámci sekce:** v 1. třetině |
- | * Doporučení zpravodaje: Doporučený | + | * **Doporučení zpravodaje:** Doporučený |
- | * Doporučení Oborové rady: Doporučený | + | * **Doporučení Oborové rady:** Doporučený |
- | * Závěrečné doporučení Grantové rady: Doporučený | + | * **Závěrečné doporučení Grantové rady:** Doporučený |