Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
dod [2017/11/21 21:49] rosa created |
dod [2024/11/13 13:58] (current) rosa [DOD v listopadu 2023] code |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Den otevřených dveří ====== | ====== Den otevřených dveří ====== | ||
+ | Stránka pro sdílení know-how o prezentaci ÚFALu na Dnech otevřených dveří (a podobných akcích). | ||
+ | |||
+ | ===== Poznámky pro budoucnost ===== | ||
+ | |||
+ | * chce to sexy název, například "Jak funguje ChatGPT?" | ||
+ | * chceme zkusit mít stánek na chodbě ve 2. patře před kanclem a ne uvnitř kanclu | ||
+ | * chceme si pořídit velkou plyšovou lamu a mít ji na stánku :-) 🦙 | ||
+ | |||
+ | |||
+ | ===== 2023 ===== | ||
+ | |||
+ | ==== DOD v listopadu 2023 ==== | ||
+ | |||
+ | Koordinuje Rudolf, viz kanál #dod na Slacku! | ||
+ | |||
+ | * stánek | ||
+ | * Rudolf Rosa, Patrícia Schmidtová, | ||
+ | * v ÚFALím kanclu N 231 🐬 | ||
+ | * dema | ||
+ | * Generování poezie | ||
+ | * https:// | ||
+ | * Buď přímo přes huggingface (ale tam se naráží na limity) | ||
+ | * Anebo na nějakém solu v terminálu, třebas takto: https:// | ||
+ | * Povídání k tomu: https:// | ||
+ | * Generování textu s hlasovým vstupem a výstupem | ||
+ | * https:// | ||
+ | * Hlavní zábava: persony (odskrollovat níže a vybrat kliknutím na obrázek) | ||
+ | * Sčítání a odčítání word embeddings | ||
+ | * spuštění například: | ||
+ | * < | ||
+ | * < | ||
+ | * < | ||
+ | * dobré příklady např.: | ||
+ | * pes - kost + myš | ||
+ | * vodka - Rusko + Česko | ||
+ | * Hitler - Německo + Rusko | ||
+ | * škola - učitel + lékař | ||
+ | * k vysvětlení např Tomášovy slajdy | ||
+ | * http:// | ||
+ | * Detailnější pokyny od TM: | ||
+ | * Ve složce ''/ | ||
+ | * Potřebuje to numpy a sklearn a pro větší modely běžet aspoň na solu | ||
+ | * jsou tam k tomu různé české embeddingy, nejlíp se mi zatím osvědčil soubor '' | ||
+ | * a taky si ten skript pamatuje historii (pohybuje se v ní normálně šipkou nahoru a dolu) a když mu dáte v --history | ||
+ | * (což bych na DOD doporučil, můžeme pak z té historie vybrat nějaké zajímavé examples, co zájemci o studium vymyslí) | ||
+ | * ty embeddingy, které mají v názvu ' | ||
+ | * mimochodem, ve výstupu vynechávám slova z promptu, kdyby se někdo třeba divil, jaktože ' | ||
+ | * Generování divadelních her | ||
+ | * https:// | ||
+ | * https:// | ||
+ | * běží, mám dojem že je to nějak horší než to bývalo, ale těžko říct | ||
+ | * Generování příběhů | ||
+ | * https:// | ||
+ | * generuje text i obrázky | ||
+ | * ale zatim to nemá hezkej vzhled, na tom teď pracuje kolega a buď to do úterka bude nebo ne | ||
+ | * Generování otisků duší | ||
+ | * https:// | ||
+ | * To asi spíš ne? To se asi na MFF moc nehodí : | ||
+ | * letáčky | ||
+ | * Zdroj: https:// | ||
+ | * PDF 2022: {{ :: | ||
+ | * nějaký asi pošle Iva, možná Zdeněk ještě upraví, vytiskneme si na Impaktu | ||
+ | * rollup -- přinést z MS | ||
+ | * zkusí poslat Iva ve spolupráci se SISALem | ||
+ | * harmonogram | ||
+ | * 8:00 sraz (Rudolf, +Patricia?) | ||
+ | * 8:45 start | ||
+ | * 10:30 hlavní nápor | ||
+ | * 13:30 přichází Zdeněk | ||
+ | * 14:30 odchází Rudolf | ||
+ | * 16:00 konec (Zdeněk, +Patricia?) | ||
+ | * přednášky | ||
+ | * N1 OBojar 14:30-14:55 LLM: Od strojového překladu k řešení všech textových úloh světa | ||
+ | * N2 Rudolf 14:45-15:30 Více než jen ChatGPT: Principy a možnosti současných nástrojů umělé inteligence (přednáška pro fakultní školy, možná to není open for all, nevím) | ||
+ | * web MFF: https:// | ||
+ | |||
+ | ==== JDIM v lednu 2023 ==== | ||
+ | |||
+ | * Dema | ||
+ | * THEaiTRE | ||
+ | * Generování scénářů divadelních her | ||
+ | * https:// | ||
+ | * QR kód: {{:: | ||
+ | * Rudolf | ||
+ | * DeriNet | ||
+ | * Slovotvorný les: jak se tvoří slova | ||
+ | * https:// | ||
+ | * Lukáš + Jonáš | ||
+ | * ELITR | ||
+ | * Živý překlad mluvené řeči do 42 jazyků | ||
+ | * https:// | ||
+ | * Dominik | ||
+ | * nápisy na polepení stánků: {{ :: | ||
+ | * letáčky viz DOD 2022, zbylé jsou zavřené ve skříni vedle věšáku v S 409 | ||
+ | * přednáška: | ||
+ | |||
+ | ===== 2022 ===== | ||
+ | |||
+ | Koordinuje Rudolf, viz kanál #dod na Slacku! | ||
+ | |||
+ | * Letáček od Zdeňka Kasnera: | ||
+ | * Zdroj: https:// | ||
+ | * PDF: {{ :: | ||
+ | * SVG: {{ :: | ||
+ | * Asi 50 výtisků se nachází u Rudolfa v kanceláři N 235 🐙 | ||
+ | * THEaiTRE: | ||
+ | * demo: https:// | ||
+ | * letáček česky: https:// | ||
+ | * sestřih videozáznamu hry: https:// | ||
+ | * Sčítání a odčítání slov: | ||
+ | * Tomášovo slajdy: http:// | ||
+ | * Tomášovo demo pomalé v Haskellu (loaduje se cca 20 minut): ''/ | ||
+ | * Tomášovo demo rychlé v Pythonu (loaduje se minutu ale padá): ''/ | ||
+ | ===== 2021 ===== | ||
+ | |||
+ | **!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** | ||
+ | |||
+ | * organizační **!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** | ||
+ | * Koordinaci stánku má na starosti Ruda (formulář vyplnil) | ||
+ | * velkou přednášku bude mít Martin Popel (nahlášeno Vladanovi Majerechovi) | ||
+ | * v pondělí 22.11. kolem 16:00 je potřeba na Malé Straně předat věci k odvozu na Impakt (1-2 projektory, 2 prodlužovačky, | ||
+ | * v úterý 23.11. je DOD, je potřeba mít někoho na stánku cca 8:00 -- 17:00 | ||
+ | * Rudolf tam bude, ale nezvládne tam být nonstop, potřebuju ještě 1-3 další dobrovolníky | ||
+ | * hardware **!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** | ||
+ | * máme zamluvené 2 stoly, 3 zásuvky, 4 židle | ||
+ | * monitory vezmeme z kanclů na Impaktu; máme je připojené přes display port, ale mají i HDMI. Tomáš Musil má v šuplíčku jeden HDMI kabel. | ||
+ | * notebooky ÚFALí ze sekretariátu (a podle potřeby + vlastní) | ||
+ | * Projektor (1-2) dovézt z MS | ||
+ | * prodlužku (1-2) možná taky z MS | ||
+ | * dema **!!! VŠECHNO JINAK, ASI TO BUDE DISTANČNĚ A STÁNEK NEBUDE !!!** | ||
+ | * určitě chceme ukazovat THEaiTRE demo | ||
+ | * URL sem nedávám protože to ještě nechceme mít úplně veřejné | ||
+ | * a k tomu asi i pouštět ukázku té divadelní hry | ||
+ | * ODušek má Alex (česky, chcete jet z Anděla) a syntézu řeči (zvlášť, nečesky) | ||
+ | * asi ukazovat tu Alex | ||
+ | * Tomáš Musil snad připraví sčítání a odčítání slov (= embedinků) | ||
+ | * ukazovat CUBBITT překlad, ukazovat příklady kde Popel překládá líp než Google | ||
+ | * Martin zkusí něco připravit, s Googlem to není problém, s DeepL je to větší problém | ||
+ | * Sunit by mohl ukazovat eye tracking | ||
+ | * Peter Polák by taky mohl mít nějaké demo | ||
+ | * další materiály | ||
+ | * letáky? | ||
+ | * ještě něco? | ||
+ | * info o studiu u nás? | ||
+ | * Bc.: program Informatika, | ||
+ | * Mgr.: program Informatika - Jazykové technologie a počítačová lingvistika, | ||
+ | * Ph.D.: program Computational linguistics / Matematická lingvistika | ||
+ | |||
+ | |||
+ | ===== 2018 ===== | ||
+ | ==== stánek ==== | ||
+ | * název: Počítačové zpracování přirozeného jazyka | ||
+ | * osazenstvo: Rudolf Rosa (7: | ||
+ | * leták | ||
+ | * PDF: {{ : | ||
+ | * SVN: https:// | ||
+ | * dema | ||
+ | * LSD demo | ||
+ | * překlad z angličtiny do češtiny, pozitivní/ | ||
+ | * http:// | ||
+ | * doprovodné slajdy k sentimentu: http:// | ||
+ | * vizualizace valence a arousal {{: | ||
+ | * Transformer demo (jen překlad): https:// | ||
+ | * Embeddings (sčítání a odčítání slov) -- to umí asi pustit jen Tomáš Musil na svém kompu | ||
+ | * doprovodné slajdy: http:// | ||
+ | * Bert (odpovídání na otázky): https:// | ||
+ | * Ptakopět (vyplňování formuláře s překladačem): | ||
+ | * NEZAVÍRAT BROWSER, UKLÁDÁ DATA DO LOCAL STORAGE (Vilda si to večer přijde sebrat) | ||
+ | * ASR (porozumí vám robot?) | ||
+ | * česky: https:// | ||
+ | * vyhodnocení: | ||
+ | * anglicky: https:// | ||
+ | * vyhodnocení: | ||
+ | * PER je position-independent error rate, tj. neco jako velikost pruniku (tokenu) deleno asi sjednocenim, | ||
+ | * WER je pocet editaci (tokenu coby atomickych jednotek) deleno asi delkou reference, nevim jiste. | ||
+ | * To " | ||
+ | * know-how | ||
+ | * prodlužovačky má paní Brdičková v dostatečném počtu | ||
+ | * embedingy jsou cool, a je to zároveň dobrej starting point pro ukazování dalších věcí | ||
+ | * nebylo by špatný mít aspoň jedno demo offline, protože internet vypadává | ||
===== 2017 ===== | ===== 2017 ===== | ||
Line 8: | Line 188: | ||
* word embeddings od Tomáše Musila (/ | * word embeddings od Tomáše Musila (/ | ||
* receptron od Petry Barančíkové | * receptron od Petry Barančíkové | ||
- | | + | * Modely jsou ulozeny na clusteru tu: / |
+ | * Poustim to tu pres ipython3 (potrebuje tensorflow a tflearn): | ||
+ | |||
+ | from train_model import * | ||
+ | m, encoding, char_indices = load_model() | ||
+ | m.make_recipe(" | ||
+ | |||
+ | | ||
* {{ :dod.pdf |PDF pro tisk}} | * {{ :dod.pdf |PDF pro tisk}} | ||
* {{ : | * {{ : | ||
+ | * zkušenosti: | ||
+ | * vyžádali jsme si jen jeden stůl a bylo to málo (už jen proto že nám tam nacpali spousta matfyzových letáků), příště vyžádat 2 stoly! (a 4 židle) | ||
+ | * je dobré se předem zajistit kabely k připojení notebooků k projektorům (naše projektory mají jen VGA, a kabel HDMI-VGA Milan Fučík nemá a nechce mít, ale půjčil nám ho Martin Mareš; microHDMI-VGA má doma Rudolf Rosa i Tomáš Musil) | ||
+ | * je dobré si vzít prodlužku | ||
+ | * je šikovné mít externí klávesnici, | ||
+ | * asi by bývalo bylo dobré mít u stánku nějak viditelně nápis s tím kdo jsme a co děláme a hlavně co to tam ukazujeme (měli jsme jen ÚFALí roll-up), to že tam v terminálu ukazujeme nějaký slova a texty není zdaleka samovysvětlující... | ||
+ | * předvádění aritmetických operací na word embeddings, když se dobře vysvětlí, tak lidem obvykle připadá zajímavé a pěkné /a těm ideálním kandidátům na budoucí ÚFALáky přímo fascinující) | ||