[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
user:hladka:playlang [2011/01/04 09:30]
hladka
user:hladka:playlang [2011/01/14 10:33]
hladka
Line 1: Line 1:
-====== Hot Issues ====== 
-   * Plan 2011 
-     * rekapitulace 
-   * [[Play the Language Competition]], december 2010 
-   * **[[http://www.acl-ijcnlp-2009.org/main/acceptedshortpapers.html|SHORT PAPERS ACCEPTED do hlavni sekce ACL 2009 a na wkshp LAW III]]**  
-  
  
  
 +====== Plan 2011 ======
  
 +====  Rekapitulace 2010 ====
 +   * na portalu prezentovany tri hry: Shannon Game (pro dva hrace), Place the Space (pro jednoho hrace), PlayCoref (pro jednoho a pro dva hrace)
 +   * vsechny tri hratelne v anglictine s vetami a s odstavci z Sherlocka Holmese
 +   * pro kazdou hru existuje demo cesky i anglicky a //how to play// pruvodce anglicky, pro Shannona i cesky
 +   * prvni predstaveni portalu sirsi odborne verejnosti [[Play the Language Competition]], december 2010
  
  
  
-====== Games with a purpose (GWAP) ======+==== Tym ==== 
 +  * Barbora Hladka (koordinace) 
 +  * Jiri Mirovsky (data) 
 +  * Jan Kohout (implementace her) 
 +  * Vladimir Rovensky (sprava LGame) 
 + 
 +==== Portal LGame ==== 
 +  * Ukoly pro Honzu Kohouta  
 +  - Presun LGame na novy server. Realizace s Milanem Fucikem. 
 +    * JK: Myslim, ze nam staci Apache server + PHP + PostgreSQL, pro zacatek asi nejlip ve stejne verzi, jako jsou na soucasnem serveru, aby nenastaly nahodou problemy s kompatibilitou. 
 +  - Ze stareho svn repozitare vytahnout zdrojak Shannona. 
 +  - Uzivatelske zprijemneni. System by si mela pamatovat, s jaky nastavenim (jazykem hrou) hrac skoncil. Pri naslednem prihlaseni se objevi prave tot nastaveni. (tj. jakou hru, jaky jazyka ma rad:-)) 
 +  - Kliknuti na vlajecku znamena, ze se zobrazi lokalizace odpovidajiciho jazyka (nebo ineho, predem stanoveneho, napr. tajstina --> anglictina). Zaroven to znamena, zase az na vyjimky, ze s texty prislusneho jazyka chce hrac hrat. Proto doplnit vlajecky k demum. 
 +  * Sjednotit obsah ceske a anglicke lokalizace. (BH) 
 +      * JK: Pridavani novych jazykovych verzi her je uz ted docela dobre navrzene, co se Flashe tyce, tak to nepotrebuje menit program, staci, kdyz se prida dalsi xml s prekladem jednotlivych popisku GUI. V PHP by to take nemelo vyzadovat vetsi zasahy (co se API jednotlivych her tyce). 
 +    * Data. Pokud nemame "spolehliva" data, brat vystupy predchozich procedur. Prvni hrac je na tom nejhur, pro nej se pouzije automaticka procedura - zohlednit pri pocitani skore. Spolehlivost anotace.  Vyzkouset u PlayCoref. 
 +    * Jake jazyky? 
 +      * Cestina a anglictina default. (Italstina rozpracovana.) 
 +    * Paralelni texty. Najit Conana Doyla v cestine (JM).  
 +  * Zamyslet se nad designem her. Upravit/sjednotit/... 
 +    * design LGame - aby se veslo na monitor, pamatuj sirokouhle monitory problem ... 
 +    * velikost hracich oken (JK, VR) 
 +    * www.ceske-hry.cz,forum (JK) 
 +  * Pro kazdou hru mit automatickou proceduru, ktera se nasadi jako (virtualni) protihrac. 
 +  * Programatorska dokumentace. (JK) 
 +  * Shannon Game 
 +    * Pro jednoho hrace. (JK) 
 +  * Place the Space 
 +    * Pridat thajstinu (ani cinstina, ani hindi nejsou vhodnymi kandidaty - bud se tam mezery pisou nebo je to jeste jinak komplikovany). Korpus s mezerama(JM) 
 +    * Implementovat verzi pro dva hrace. 
 +    * Podrobnosti na strance [[Place the space]]. 
 +  * PlayCoref  
 +    * Analyza dat z prosincove souteze. Export tabulek (JK) --> JM 
 +  * Nove hry 
 +    * Pojmenovane entity - viz [[PlayNE]]. 
 +    * Koherence vety/odstavce. Na vstupu prehazena slova vety, hrac je usporada dle jeho citu "spravne". Na urovni odstavcu by se zamichalo s poradim vet. 
 +    * ... 
 +   * **Vypsat rocnikove projekty, bakalarky, diplomky!** VOlnost v technologiich, ale pozor na PLUGINS!!! 
 + 
 +==== Prezentace, demonstrace, publikace ==== 
 +  * GACR 2012 (po trech neuspesnych pokusech frustrace, ale ... ) 
 +  * PBML 96, rozsah: 20 stranek, deadline: May 30, 2011. 
 +  * [[http://www.ijcnlp2011.org/|IJCNLP]], Chiang Mai, Thailand, Nov 8-13, System Demo, deadline: May 20, 2011. 
 +  * ... 
 + 
 +==== Finance ==== 
 +  - OON 
 +    - Jan Kohout, student, 24 tis. 
 +    - Vladimir Rovensky, student, 5 tis. 
 +  - Sluzby 
 +    - Design her, 20 tis. 
 +  - Naklady na prezentaci, 20 tis. 
 +  - LGame hosting, cca 2 tis. (nevim presne) 
 + 
 +====== Motivation ====== 
 + 
 +===== Games with a purpose (GWAP) =====
    *[[http://www.gwap.com|images, tunes]], "nějaká" data z ESP Game a z Peekaboom jsou ke [[http://hunch.net/?cat=17|stažení]] (zalistuj trochu níž)    *[[http://www.gwap.com|images, tunes]], "nějaká" data z ESP Game a z Peekaboom jsou ke [[http://hunch.net/?cat=17|stažení]] (zalistuj trochu níž)
    *[[http://www.ontogame.org|ontologies]] (semantic web)     *[[http://www.ontogame.org|ontologies]] (semantic web) 
Line 39: Line 95:
  
  
-====== Related initiatives ======+===== Related initiatives =====
    *[[http://www.openmind.org/|Open Mind]]    *[[http://www.openmind.org/|Open Mind]]
    *[[https://www.mturk.com/mturk/welcome|Amazon Mechanical Turk]] is an online labor market where workers are paid small amount of money to complete small tasks.    *[[https://www.mturk.com/mturk/welcome|Amazon Mechanical Turk]] is an online labor market where workers are paid small amount of money to complete small tasks.
Line 57: Line 113:
  
  
-====== Papers/Videos to read/watch ======+===== Papers/Videos to read/watch =====
    * (Snow et al., 2008) [[http://ufal.mff.cuni.cz/~hladka/gwap/amt_emnlp08_accepted.pdf|Cheap and Fast - But is it Good? ... ]], Proceedings of the Conference on Empirical Methods in Natural Language Processing, Waikiki, Honolulu, Hawaii, 2008, pp. TBA. ''affect recognition, word similarity, recognizing textual entailment, event temporal ordering, word sense disambiguation''; see discussion at [[http://blog.doloreslabs.com/2008/09/amt-fast-cheap-good-machine-learning/|Dolores' blog]]    * (Snow et al., 2008) [[http://ufal.mff.cuni.cz/~hladka/gwap/amt_emnlp08_accepted.pdf|Cheap and Fast - But is it Good? ... ]], Proceedings of the Conference on Empirical Methods in Natural Language Processing, Waikiki, Honolulu, Hawaii, 2008, pp. TBA. ''affect recognition, word similarity, recognizing textual entailment, event temporal ordering, word sense disambiguation''; see discussion at [[http://blog.doloreslabs.com/2008/09/amt-fast-cheap-good-machine-learning/|Dolores' blog]]
       * Bara's summary:       * Bara's summary:
Line 68: Line 124:
    *[[http://research.google.com/roundtable/HLT.html|Google Technology RoundTable, Mike Cohen, Franz Josef Och]]    *[[http://research.google.com/roundtable/HLT.html|Google Technology RoundTable, Mike Cohen, Franz Josef Och]]
  
-====== Ideas ======+====== Our ideas ======
 Date: Fri, 10 Oct 2008 09:42:43 +0200, updated on Tue, 7 Apr 2009 Date: Fri, 10 Oct 2008 09:42:43 +0200, updated on Tue, 7 Apr 2009
 From: Jiří Mírovský  From: Jiří Mírovský 
Line 85: Line 141:
  
  
-====== The Project Directory ======+====== The PlayLang Project ====== 
 + 
 +===== Directory structure =====
  
 Projekt využívá SVN repozitář, návod k použití zde: Projekt využívá SVN repozitář, návod k použití zde:
Line 94: Line 152:
 /net/projects/playlang_shared /net/projects/playlang_shared
  
-====== Data Format (and Tred Support) for the Project Play the Language ======+===== Data Format (and Tred Support) for the Project Play the Language =====
 Date: Wed, 24 Dec 2008, updated Tue, 6 Jan 2009, again Fri, 27 Mar 2009 Date: Wed, 24 Dec 2008, updated Tue, 6 Jan 2009, again Fri, 27 Mar 2009
 From: Jiří Mírovský  From: Jiří Mírovský 
  
-==== Návrh formátu pro playlang (minimálně playcoref): rozšíření m-roviny z PDT 2.0 ====+=== Návrh formátu pro playlang (minimálně playcoref): rozšíření m-roviny z PDT 2.0 ===
 Důvody: Důvody:
   * automatická lemmatizace a morfologická disambiguace textů je uspokojivě zvládnutý problém, pro nás téměř zadarmo   * automatická lemmatizace a morfologická disambiguace textů je uspokojivě zvládnutý problém, pro nás téměř zadarmo
Line 104: Line 162:
   * automatické procedury pro předzpracování textů (např. detekce kandidátů pro koreferenci) budou lemmatizaci a morfologii nejspíš potřebovat   * automatické procedury pro předzpracování textů (např. detekce kandidátů pro koreferenci) budou lemmatizaci a morfologii nejspíš potřebovat
   * morfologická rovina jde dobře zobrazit v Tredu   * morfologická rovina jde dobře zobrazit v Tredu
 +
 ==== Schéma rozšířené m-roviny: ==== ==== Schéma rozšířené m-roviny: ====
 PML schéma je zde: {ROOT}/playcoref/tred_extension/ PML schéma je zde: {ROOT}/playcoref/tred_extension/
Line 110: Line 169:
     * lock - pro účely hry PlayCoref zamyká či odemyká jednotlivé šipky (hodnoty: locked/unlocked)     * lock - pro účely hry PlayCoref zamyká či odemyká jednotlivé šipky (hodnoty: locked/unlocked)
  
-==== Převod dat PDT 2.0 do formátu playlang: ====+=== Převod dat PDT 2.0 do formátu playlang: ===
 V adresáři {ROOT}/playcoref/scripts jsou skripty pro převod textové a gramatické koreference z tektogramatické roviny do rozšířené m-roviny: V adresáři {ROOT}/playcoref/scripts jsou skripty pro převod textové a gramatické koreference z tektogramatické roviny do rozšířené m-roviny:
  

[ Back to the navigation ] [ Back to the content ]