[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
dod [2023/10/17 01:54]
rosa [DOD v listopadu 2023]
dod [2024/11/13 13:58] (current)
rosa [DOD v listopadu 2023] code
Line 1: Line 1:
 ====== Den otevřených dveří ====== ====== Den otevřených dveří ======
 Stránka pro sdílení know-how o prezentaci ÚFALu na Dnech otevřených dveří (a podobných akcích). Stránka pro sdílení know-how o prezentaci ÚFALu na Dnech otevřených dveří (a podobných akcích).
 +
 +===== Poznámky pro budoucnost =====
 +
 +  * chce to sexy název, například "Jak funguje ChatGPT?"
 +  * chceme zkusit mít stánek na chodbě ve 2. patře před kanclem a ne uvnitř kanclu
 +  * chceme si pořídit velkou plyšovou lamu a mít ji na stánku :-) 🦙
 +
  
 ===== 2023 ===== ===== 2023 =====
Line 8: Line 15:
 Koordinuje Rudolf, viz kanál #dod na Slacku! Koordinuje Rudolf, viz kanál #dod na Slacku!
  
-  * dema +  * stánek 
-  * letáčky+    * Rudolf Rosa, Patrícia Schmidtová, Zdeněk Kasner 
 +    * v ÚFALím kanclu N 231 🐬 
 +    * dema 
 +      * Generování poezie 
 +        * https://huggingface.co/jinymusim/gpt-czech-poet 
 +        * Buď přímo přes huggingface (ale tam se naráží na limity) 
 +        * Anebo na nějakém solu v terminálu, třebas takto: https://github.com/ufal/dod/blob/main/gpt-czech-poet-userfriendly.py 
 +        * Povídání k tomu: https://docs.google.com/document/d/15Gd79Kdx70OavSctt7z7BK40v27F8PLWO40t5QJZlO0/edit?usp=sharing 
 +      * Generování textu s hlasovým vstupem a výstupem 
 +        * https://quest.ms.mff.cuni.cz/nlg/text-generation-webui/ 
 +        * Hlavní zábava: persony (odskrollovat níže a vybrat kliknutím na obrázek) 
 +      * Sčítání a odčítání word embeddings 
 +        * spuštění například: 
 +          * <code>srun -p cpu-troja,cpu-ms --mem=50G --cpus-per-task=8 --pty bash</code> 
 +          * <code>cd /home/musil/lnet_work_musil/emb_ar</code> 
 +          * <code>python3 emb_arithm.py syn9_w15_lemma.pkl --history ~/my_history_file.txt</code> 
 +        * dobré příklady např.: 
 +          * pes - kost + myš 
 +          * vodka - Rusko + Česko 
 +          * Hitler - Německo + Rusko 
 +          * škola - učitel + lékař 
 +        * k vysvětlení např Tomášovy slajdy 
 +          * http://tomasm.cz/slides/lmph/slides.pdf 
 +        * Detailnější pokyny od TM: 
 +          * Ve složce ''/home/musil/lnet_work_musil/emb_ar'' je skript emb_arithm.py , kterému se dá jako argument soubor s embeddingy v mém vlastním formátu. Načte to během pár desítek vteřin seznam embeddingů + ball tree, který dokáže efektivně hledat nejbližší sousedy v řádu nízkých jednotek sekund (v závistlosti na množství a velikosti embeddingů). 
 +          * Potřebuje to numpy a sklearn a pro větší modely běžet aspoň na solu 
 +          * jsou tam k tomu různé české embeddingy, nejlíp se mi zatím osvědčil soubor ''cnk_lemma_norm_embs_ar.pkl'', což jsou nějaké staré embeddingy na ČNK syn4, které mají dimenzi jenom 100; nové embeddingy na syn9 s větší dimenzí kupodivu nefungují tak pěkně 
 +          * a taky si ten skript pamatuje historii (pohybuje se v ní normálně šipkou nahoru a dolu) a když mu dáte v --history  nějaký file, tak si v něm bude historii udržovat i mezi běhy 
 +          * (což bych na DOD doporučil, můžeme pak z té historie vybrat nějaké zajímavé examples, co zájemci o studium vymyslí) 
 +          * ty embeddingy, které mají v názvu 'lemma' jsou na lemmatech, což mi přijde lepší, protože pak ve výstupu není opakované totéž v různých tvarech; ale zase se na nich nedají předvádět morfologické analogie 
 +          * mimochodem, ve výstupu vynechávám slova z promptu, kdyby se někdo třeba divil, jaktože 'pes' není nejbližší sám sobě 
 +      * Generování divadelních her 
 +        * https://theaitre.com/demo 
 +        * https://ufallab.ms.mff.cuni.cz/cgi-bin/rosa/theaitre-demo/demo.py 
 +        * běží, mám dojem že je to nějak horší než to bývalo, ale těžko říct 
 +      * Generování příběhů 
 +        * https://ufal.mff.cuni.cz/AIvK/exponat/sekce/pribehy/ 
 +        * generuje text i obrázky 
 +        * ale zatim to nemá hezkej vzhled, na tom teď pracuje kolega a buď to do úterka bude nebo ne 
 +      * Generování otisků duší 
 +        * https://bit.ly/clovek-duse-ai 
 +        * To asi spíš ne? To se asi na MFF moc nehodí :slightly_smiling_face: 
 +    * letáčky 
 +      * Zdroj: https://www.canva.com/design/DAFQx44Q3_A/Auet77a9F4j6MGBsYOm13Q/edit 
 +      * PDF 2022: {{ ::letacek_ufal_dod_2022_tisk.pdf |}} 
 +      * nějaký asi pošle Iva, možná Zdeněk ještě upraví, vytiskneme si na Impaktu 
 +    * rollup -- přinést z MS 
 +      * zkusí poslat Iva ve spolupráci se SISALem 
 +    * harmonogram 
 +      * 8:00 sraz (Rudolf, +Patricia?
 +      * 8:45 start 
 +      * 10:30 hlavní nápor 
 +      * 13:30 přichází Zdeněk 
 +      * 14:30 odchází Rudolf 
 +      * 16:00 konec (Zdeněk, +Patricia?)
   * přednášky   * přednášky
 +    * N1 OBojar 14:30-14:55 LLM: Od strojového překladu k řešení všech textových úloh světa
 +    * N2 Rudolf 14:45-15:30 Více než jen ChatGPT: Principy a možnosti současných nástrojů umělé inteligence (přednáška pro fakultní školy, možná to není open for all, nevím)
 +  * web MFF: https://www.mff.cuni.cz/cs/uchazeci/dny-otevrenych-dveri/2023
  
 ==== JDIM v lednu 2023 ==== ==== JDIM v lednu 2023 ====

[ Back to the navigation ] [ Back to the content ]