[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:hladka:playcoref [2009/06/02 08:54]
hladka
user:hladka:playcoref [2010/02/09 09:24] (current)
hladka
Line 1: Line 1:
 ====== Play the Language: Play Coreference ====== ====== Play the Language: Play Coreference ======
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +====== Aktuality ======
 +  * COLING 2010, deadline **Apr 22, 2010**
 +      * vyvěsit PlayCoref na LGame hratelnou ČESKY a ANGLICKY, proto
 +         * nachystat anglická data - Jak jsme na tom? Nějaká jsme už dávali dohromady, ne?
 +         * Honzu a Lenku připravit na zapojení angličtiny.
 +         * zapojit pojmenované entity
 +            *  pro češtinu Jirka nachystal a poslal Lence data. BH: kontaktovat Lenku.
 +            *  Jirko, v rámci TectoMT je taky nejspíš anglický NE recognizer? 
 +         * Pavle mohl bys prosím kontaktovat kamaráda, který programuje hry v NY, ukázat mu [[ http://ufallab2.ms.mff.cuni.cz/lgame/sb/play_coref_index.php|aktuální verzi PlayCoref]] a požádat o názor.
 +         * BH a Honza Kohout. nachystat demo PlayCoref (jako např. [[http://ufallab2.ms.mff.cuni.cz/lgame/pts.php|toto]]).              
 +         * BH: připravit pravidla hry (jako např. [[http://ufallab2.ms.mff.cuni.cz/lgame/guide.php|tato]]).
 +  * Zimní seminář v Hejnicích, krátká prezentace screenshotů alfa verze hry, 25.1.2010
 +     * Na úvodní stránce s výběrem počtu hráčů přidat počet on-line hráčů - tak vím, zda má smysl zvolit hru dvou hráčů a doufat v protihráče
 +     * Na úvodní stránce je špatně čitelný ten velký kulatý font
 +     * Dvě verze instrukcí: krátké pro rychlé seznámení a zahrání si, dlouhé pro ty, kdo se chtějí zlepšit a mít lepší skóre.
 +      * **BH**: Souhlasim (tak tomu je ted i u Shannon game). Kratke instrukce maji format dema, dlouhe jsou jako text doplneny screenshots.    
 +     * Pokud to půjde, využít systému Recaptcha - část textu už použita dříve v jiné hře - už mám nějakou anotaci - mohu počítat skóre, zbytek textu nový, získávám nová data
 +     * Anotace koreference musí probíhat na jmenných frázích - nelze propojit slova "ekonomika" ve frázích "německá ekonomika" a "česká ekonomika". Otázka je, zda to hráčům jen vysvětlit, nebo jim jmenné fráze rozpoznat, spojit do anotační jednotky a označit (je to těžké).
 +     * Padlo několik návrhů k propadaci hry - např. Lucie nabízí, že hru zadá studentům jako povinnou součást výuky svého semináře
 +
 +  * Schůzka 24/9/2009
 +     * Sestava: studenti Jan Kohout, Lenka Studničná; badatelé Bára, Jirka, Pavel
 +     * Rozhodnutí:
 +         * Lenka: implementace "vnitřku"
 +         * Honza: implementace rozhraní ve spolupráci se studentkou Helenou Pouchovou
 +         * My: data - zpracování dat ACR a procedurou detekující jmenné entity 
 +      * Termín: 30. října 2009
 +      * Plány: submitnout abstract na demo session na [[http://www.lrec-conf.org/lrec2010/|LREC 2010]], termín je 31. října 2009 - uvidíme, jak se bude vyvíjet implementace
 +
  
 ====== Motivace ====== ====== Motivace ======
Line 196: Line 241:
  
  
-===== Pro toho, kdo bude hru implementovat =====+ 
 + 
 + 
 + 
 +===== Kdo hru implementuje ===== 
 +  * Lenka Studničná vnitřek, [[http://ufal.mff.cuni.cz/~hladka/PlayCoref/playCoref-specifikace.pdf|zde]] je specifikace. 
 +      * Poznámky BH: 
 +      - 1.1 Pokud není protihráč, tak automaticky nastupuje virtuální protihráč, tedy automatická procedura. Hráč by o tom ani nemusel vědět. Proto bych volbu mezi protihráčem a automatickým protihráčem vypustila. 
 +      - 1.2 Dle designu hry. 
 +      - 2.1 použití termínu ´paralelních dat´je v daném kontextu lehce zavádějící (i když chápu, jak to autorka myslela) 
 +      - Jeden hráč se vzdá, další může samozřejmě pokračovat. Pro měření spolehlivosti hráče je zajímavé vědět i to, kolikrát vzdal. 
 +      - 2. Vstupní dokumenty budou zpracovány ACR. 
 +      - 3. V tabulce Matches_Players postrádám odkaz na soupeře. 
 +      - 3. Alternativy - Pokud budeme předkládat anotovaná data, může být obtížnost dokumentu vyjádřena přes počet přítomných koreferujících párů. 
 +      - 5. Víceslovné výrazy -- určitě na ně myslet v implementaci, i když aktuálně není k dispozici automatická procedura pro detekci víceslovnýcch pojmenovaných entit s uspokojující úspěšností. 
 + 
 + 
 + 
  
 ====== ACL - IJCNLP2009 ====== ====== ACL - IJCNLP2009 ======

[ Back to the navigation ] [ Back to the content ]