[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
dod [2021/10/20 11:06]
hladka [2021]
dod [2023/11/20 18:36]
rosa [DOD v listopadu 2023]
Line 2: Line 2:
 Stránka pro sdílení know-how o prezentaci ÚFALu na Dnech otevřených dveří (a podobných akcích). Stránka pro sdílení know-how o prezentaci ÚFALu na Dnech otevřených dveří (a podobných akcích).
  
 +===== 2023 =====
 +
 +==== DOD v listopadu 2023 ====
 +
 +Koordinuje Rudolf, viz kanál #dod na Slacku!
 +
 +  * stánek
 +    * Rudolf Rosa, Patrícia Schmidtová, Zdeněk Kasner
 +    * v ÚFALím kanclu N 231 🐬
 +    * dema
 +      * Generování poezie
 +        * https://huggingface.co/jinymusim/gpt-czech-poet
 +        * Buď přímo přes huggingface (ale tam se naráží na limity)
 +        * Anebo na nějakém solu v terminálu, třebas takto: https://github.com/ufal/dod/blob/main/gpt-czech-poet-userfriendly.py
 +        * Povídání k tomu: https://docs.google.com/document/d/15Gd79Kdx70OavSctt7z7BK40v27F8PLWO40t5QJZlO0/edit?usp=sharing
 +      * Generování textu s hlasovým vstupem a výstupem
 +        * https://quest.ms.mff.cuni.cz/nlg/text-generation-webui/
 +        * Hlavní zábava: persony (odskrollovat níže a vybrat kliknutím na obrázek)
 +      * Sčítání a odčítání word embeddings
 +        * spuštění například:
 +          * ''srun -p cpu-troja,cpu-ms --mem=50G --cpus-per-task=8 --pty bash''
 +          * ''cd /home/musil/lnet_work_musil/emb_ar''
 +          * ''python3 emb_arithm.py syn9_w15_lemma.pkl --history ~/my_history_file.txt''
 +        * dobré příklady např.:
 +          * pes - kost + myš
 +          * vodka - Rusko + Česko
 +          * Hitler - Německo + Rusko
 +          * škola - učitel + lékař
 +        * k vysvětlení např Tomášovy slajdy
 +          * http://tomasm.cz/slides/lmph/slides.pdf
 +        * Detailnější pokyny od TM:
 +          * Ve složce ''/home/musil/lnet_work_musil/emb_ar'' je skript emb_arithm.py , kterému se dá jako argument soubor s embeddingy v mém vlastním formátu. Načte to během pár desítek vteřin seznam embeddingů + ball tree, který dokáže efektivně hledat nejbližší sousedy v řádu nízkých jednotek sekund (v závistlosti na množství a velikosti embeddingů).
 +          * Potřebuje to numpy a sklearn a pro větší modely běžet aspoň na solu
 +          * jsou tam k tomu různé české embeddingy, nejlíp se mi zatím osvědčil soubor ''cnk_lemma_norm_embs_ar.pkl'', což jsou nějaké staré embeddingy na ČNK syn4, které mají dimenzi jenom 100; nové embeddingy na syn9 s větší dimenzí kupodivu nefungují tak pěkně
 +          * a taky si ten skript pamatuje historii (pohybuje se v ní normálně šipkou nahoru a dolu) a když mu dáte v --history  nějaký file, tak si v něm bude historii udržovat i mezi běhy
 +          * (což bych na DOD doporučil, můžeme pak z té historie vybrat nějaké zajímavé examples, co zájemci o studium vymyslí)
 +          * ty embeddingy, které mají v názvu 'lemma' jsou na lemmatech, což mi přijde lepší, protože pak ve výstupu není opakované totéž v různých tvarech; ale zase se na nich nedají předvádět morfologické analogie
 +          * mimochodem, ve výstupu vynechávám slova z promptu, kdyby se někdo třeba divil, jaktože 'pes' není nejbližší sám sobě
 +      * Generování divadelních her
 +        * https://theaitre.com/demo
 +        * https://ufallab.ms.mff.cuni.cz/cgi-bin/rosa/theaitre-demo/demo.py
 +        * běží, mám dojem že je to nějak horší než to bývalo, ale těžko říct
 +      * Generování příběhů
 +        * https://ufal.mff.cuni.cz/AIvK/exponat/sekce/pribehy/
 +        * generuje text i obrázky
 +        * ale zatim to nemá hezkej vzhled, na tom teď pracuje kolega a buď to do úterka bude nebo ne
 +      * Generování otisků duší
 +        * https://bit.ly/clovek-duse-ai
 +        * To asi spíš ne? To se asi na MFF moc nehodí :slightly_smiling_face:
 +    * letáčky
 +      * Zdroj: https://www.canva.com/design/DAFQx44Q3_A/Auet77a9F4j6MGBsYOm13Q/edit
 +      * PDF 2022: {{ ::letacek_ufal_dod_2022_tisk.pdf |}}
 +      * nějaký asi pošle Iva, možná Zdeněk ještě upraví, vytiskneme si na Impaktu
 +    * rollup -- přinést z MS
 +      * zkusí poslat Iva ve spolupráci se SISALem
 +    * harmonogram
 +      * 8:00 sraz (Rudolf, +Patricia?)
 +      * 8:45 start
 +      * 10:30 hlavní nápor
 +      * 13:30 přichází Zdeněk
 +      * 14:30 odchází Rudolf
 +      * 16:00 konec (Zdeněk, +Patricia?)
 +  * přednášky
 +    * N1 OBojar 14:30-14:55 LLM: Od strojového překladu k řešení všech textových úloh světa
 +    * N2 Rudolf 14:45-15:30 Více než jen ChatGPT: Principy a možnosti současných nástrojů umělé inteligence (přednáška pro fakultní školy, možná to není open for all, nevím)
 +  * web MFF: https://www.mff.cuni.cz/cs/uchazeci/dny-otevrenych-dveri/2023
 +
 +==== JDIM v lednu 2023 ====
 +
 +  * Dema
 +    * THEaiTRE
 +      * Generování scénářů divadelních her
 +      * https://theaitre.com/demo
 +      * QR kód: {{::e8e712050ddacee1af8b140f8e38288a.png?200|}}
 +      * Rudolf
 +    * DeriNet
 +      * Slovotvorný les: jak se tvoří slova
 +      * https://lukyjanek.github.io/subpages/2023-jdim-demo-annotation/UDerAnnotation.html
 +      * Lukáš + Jonáš
 +    * ELITR
 +      * Živý překlad mluvené řeči do 42 jazyků
 +      * https://quest.ms.mff.cuni.cz/elitr/demo/
 +      * Dominik
 +  * nápisy na polepení stánků: {{ ::jdim_cedulky.odt |}}
 +  * letáčky viz DOD 2022, zbylé jsou zavřené ve skříni vedle věšáku v S 409
 +  * přednáška: https://bit.ly/theaitre-jdim-2023
 +
 +===== 2022 =====
 +
 +Koordinuje Rudolf, viz kanál #dod na Slacku!
 +
 +  * Letáček od Zdeňka Kasnera:
 +    * Zdroj: https://www.canva.com/design/DAFQx44Q3_A/Auet77a9F4j6MGBsYOm13Q/edit
 +    * PDF: {{ ::letacek_ufal_dod_2022_tisk.pdf |}}
 +    * SVG: {{ ::letacek_dod_svg.zip |}} (konvertováno přes Inkscape z PDF + font)
 +    * Asi 50 výtisků se nachází u Rudolfa v kanceláři N 235 🐙
 +  * THEaiTRE:
 +    * demo: https://theaitre.com/demo
 +    * letáček česky: https://docs.google.com/document/d/1RCzOS5RE8u6CERcEz_rxhsQ10TYCGh5qpy8Pj56HHrw/edit?usp=sharing
 +    * sestřih videozáznamu hry: https://youtu.be/apPLTXbuFkg
 +  * Sčítání a odčítání slov:
 +    * Tomášovo slajdy: http://tomasm.cz/slides/lmph/slides.pdf
 +    * Tomášovo demo pomalé v Haskellu (loaduje se cca 20 minut): ''/home/musil/scitani_slov'' ... ''scitani.sh''
 +    * Tomášovo demo rychlé v Pythonu (loaduje se minutu ale padá): ''/home/musil/scitani_slov'' ... ''scitani.py cnk-slemma-100-15-normalized.txt''
 ===== 2021 ===== ===== 2021 =====
  
-  * Koordinaci stánku má na starosti Ruda (formulář vyplnil) +**!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** 
-  * velkou přednášku bude mít Martin Popel (nahlášeno Vladanovi Majerechovi) + 
-  * Monitory na Impaktu máme připojené přes display port, ale mají i HDMI. Tomáš Musil má v šuplíčku jeden HDMI kabel.+  * organizační **!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** 
 +    * Koordinaci stánku má na starosti Ruda (formulář vyplnil) 
 +    * velkou přednášku bude mít Martin Popel (nahlášeno Vladanovi Majerechovi) 
 +    * v pondělí 22.11. kolem 16:00 je potřeba na Malé Straně předat věci k odvozu na Impakt (1-2 projektory, 2 prodlužovačky, HDMI kabely?) 
 +    * v úterý 23.11. je DOD, je potřeba mít někoho na stánku cca 8:00 -- 17:00 
 +      * Rudolf tam bude, ale nezvládne tam být nonstop, potřebuju ještě 1-3 další dobrovolníky 
 +  * hardware **!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** 
 +    * máme zamluvené 2 stoly, 3 zásuvky, 4 židle 
 +    * monitory vezmeme z kanclů na Impaktumáme je připojené přes display port, ale mají i HDMI. Tomáš Musil má v šuplíčku jeden HDMI kabel. 
 +    * notebooky ÚFALí ze sekretariátu (a podle potřeby + vlastní) 
 +    * Projektor (1-2) dovézt z MS 
 +    * prodlužku (1-2) možná taky z MS 
 +  * dema **!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** 
 +    * určitě chceme ukazovat THEaiTRE demo 
 +      * URL sem nedávám protože to ještě nechceme mít úplně veřejné 
 +      * a k tomu asi i pouštět ukázku té divadelní hry 
 +    * ODušek má Alex (česky, chcete jet z Anděla) a syntézu řeči (zvlášť, nečesky) 
 +      * asi ukazovat tu Alex 
 +    * Tomáš Musil snad připraví sčítání a odčítání slov (= embedinků) 
 +    * ukazovat CUBBITT překlad, ukazovat příklady kde Popel překládá líp než Google 
 +      * Martin zkusí něco připravit, s Googlem to není problém, s DeepL je to větší problém 
 +    * Sunit by mohl ukazovat eye tracking 
 +    * Peter Polák by taky mohl mít nějaké demo 
 +  * další materiály 
 +    * letáky? 
 +    * ještě něco? 
 +    * info o studiu u nás? 
 +      * Bc.: program Informatika, specializace Umělá inteligence, zaměření Zpracování přirozeného jazyka 
 +      * Mgr.: program Informatika - Jazykové technologie a počítačová lingvistika, 2 zaměření (počítačová a formální lingvistika; statistické metody a metody strojového učení pro zpracování jazyka) 
 +      * Ph.D.: program Computational linguistics / Matematická lingvistika 
  
 ===== 2018 ===== ===== 2018 =====

[ Back to the navigation ] [ Back to the content ]