[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
dod [2023/11/16 12:20]
rosa [DOD v listopadu 2023]
dod [2023/11/16 20:01]
rosa [DOD v listopadu 2023]
Line 10: Line 10:
   * stánek   * stánek
     * Rudolf Rosa, Patrícia Schmidtová, Zdeněk Kasner     * Rudolf Rosa, Patrícia Schmidtová, Zdeněk Kasner
-    * v některém ÚFALím kanclu+    * v některém ÚFALím kanclu, asi N 231 🐬
     * dema     * dema
 +      * Generování poezie
 +        * https://huggingface.co/jinymusim/gpt-czech-poet
 +        * Buď přímo přes huggingface anebo asi pustit vzdáleně v terminálu interaktivně? (Nezkoušel jsem to, ale věřím že když  copy-pastnu ten sample python kód z té stránky tak nebude problém to na nějakém gpu stroji rozběhat.)
 +      * Generování textu s hlasovým vstupem a výstupem
 +        * https://quest.ms.mff.cuni.cz/nlg/text-generation-webui/
 +      * Sčítání a odčítání word embeddings
 +        * ''ssh sol3; cd /home/musil/lnet_work_musil/emb_ar; python3 emb_arithm.py cnk_lemma_norm_embs_ar.pkl --history ~/my_history_file.txt''
 +        * Ve složce ''/home/musil/lnet_work_musil/emb_ar'' je skript emb_arithm.py , kterému se dá jako argument soubor s embeddingy v mém vlastním formátu. Načte to během pár desítek vteřin seznam embeddingů + ball tree, který dokáže efektivně hledat nejbližší sousedy v řádu nízkých jednotek sekund (v závistlosti na množství a velikosti embeddingů).
 +        * Potřebuje to numpy a sklearn a pro větší modely běžet aspoň na solu
 +        * jsou tam k tomu různé české embeddingy, nejlíp se mi zatím osvědčil soubor ''cnk_lemma_norm_embs_ar.pkl'', což jsou nějaké staré embeddingy na ČNK syn4, které mají dimenzi jenom 100; nové embeddingy na syn9 s větší dimenzí kupodivu nefungují tak pěkně
 +        * a taky si ten skript pamatuje historii (pohybuje se v ní normálně šipkou nahoru a dolu) a když mu dáte v --history  nějaký file, tak si v něm bude historii udržovat i mezi běhy
 +        * (což bych na DOD doporučil, můžeme pak z té historie vybrat nějaké zajímavé examples, co zájemci o studium vymyslí)
 +        * ty embeddingy, které mají v názvu 'lemma' jsou na lemmatech, což mi přijde lepší, protože pak ve výstupu není opakované totéž v různých tvarech; ale zase se na nich nedají předvádět morfologické analogie
 +        * mimochodem, ve výstupu vynechávám slova z promptu, kdyby se někdo třeba divil, jaktože 'pes' není nejbližší sám sobě
 +      * Generování divadelních her
 +        * https://theaitre.com/demo
 +        * pokud ho rozběhnu
 +      * Generování příběhů
 +        * https://ufal.mff.cuni.cz/AIvK/exponat/sekce/pribehy/
 +        * generuje text i obrázky
 +        * ale zatim to nemá hezkej vzhled, na tom teď pracuje kolega a buď to do úterka bude nebo ne
 +      * Generování otisků duší
 +        * https://bit.ly/clovek-duse-ai
 +        * To asi spíš ne? To se asi na MFF moc nehodí :slightly_smiling_face:
     * letáčky     * letáčky
       * Zdroj: https://www.canva.com/design/DAFQx44Q3_A/Auet77a9F4j6MGBsYOm13Q/edit       * Zdroj: https://www.canva.com/design/DAFQx44Q3_A/Auet77a9F4j6MGBsYOm13Q/edit

[ Back to the navigation ] [ Back to the content ]