Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:playlang [2009/06/08 14:32] mirovsky |
user:hladka:playlang [2011/01/21 15:37] mirovsky |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== HOT ISSUES ====== | ||
- | * **[[http:// | ||
- | * [[PlayCoref]] | ||
- | * [[Place the Space]] | ||
- | ---- | ||
- | * Projit si hry, ktere vydavaji velka vydavatelstvi (Hasbro, ...) a hledat motivaci. | ||
- | ---- | ||
- | * Ze setkani 28. listopadu 2008 | ||
- | * Pavel: muze zacit s experimenty | ||
- | * 8-) Jirka: Prevod koreference v tektogramatickych stromech anotovanych Anjou a kol. do povrchu - viz nize oddil Data Format for the Project Play the Language | ||
- | * 8-) Bara: najit studenty k implementaci prvnich dvou her z casti ' | ||
- | * Trac system - jak to s nim je? | ||
- | * [[http:// | ||
- | * Pamatovat si: | ||
- | * Pracovat s texty v kodovani UTF-8. | ||
+ | ====== Plan 2011 ====== | ||
+ | ==== Rekapitulace 2010 ==== | ||
+ | * na portalu prezentovany tri hry: Shannon Game (pro dva hrace), Place the Space (pro jednoho hrace), PlayCoref (pro jednoho a pro dva hrace) | ||
+ | * vsechny tri hratelne v anglictine s vetami a s odstavci z Sherlocka Holmese | ||
+ | * pro kazdou hru existuje demo cesky i anglicky a //how to play// pruvodce anglicky, pro Shannona i cesky | ||
+ | * prvni predstaveni portalu sirsi odborne verejnosti [[Play the Language Competition]], | ||
- | ====== Games with a purpose (GWAP) | + | |
+ | |||
+ | ==== Tym ==== | ||
+ | * Barbora Hladka (koordinace) | ||
+ | * Jiri Mirovsky (data) | ||
+ | * Jan Kohout (implementace her) | ||
+ | * Vladimir Rovensky (sprava LGame) | ||
+ | |||
+ | ==== Schuzky | ||
+ | * 31. ledna, 11:30, chodba k S1 | ||
+ | |||
+ | |||
+ | ==== Portal LGame ==== | ||
+ | * **Ukoly pro Honzu** | ||
+ | - Presun LGame na novy server. Realizace s Milanem Fucikem. (//Do konce ledna//) | ||
+ | * JK: Myslim, ze nam staci Apache server + PHP + PostgreSQL, pro zacatek asi nejlip ve stejne verzi, jako jsou na soucasnem serveru, aby nenastaly nahodou problemy s kompatibilitou. | ||
+ | - Kliknuti na vlajecku znamena, ze se zobrazi lokalizace odpovidajiciho jazyka (nebo jineho, predem stanoveneho, | ||
+ | * JK: Pridavani novych jazykovych verzi her je uz ted docela dobre navrzene, co se Flashe tyce, tak to nepotrebuje menit program, staci, kdyz se prida dalsi xml s prekladem jednotlivych popisku GUI. V PHP by to take nemelo vyzadovat vetsi zasahy (co se API jednotlivych her tyce). | ||
+ | - Na vhodnych forech hledat designera. (Vyvesit inzerat //do konce ledna//) | ||
+ | - Zvetsit velikost hracich oken ve spolupraci s Vladimirem. (//Do 25. ledna//) | ||
+ | - Programatorska dokumentace. (//Do konce unora//) | ||
+ | - Export dat ze souteze PlayCoref --> preslat Jirkovi. (//Do konce ledna//) | ||
+ | - Uzivatelske zprijemneni. System by si mel pamatovat, s jaky nastavenim portalu hrac skoncil. Pri naslednem prihlaseni se objevi prave toto nastaveni. (tj. jakou hru, jaky jazyk ma uzivatel rad:-)) | ||
+ | - Data. Pokud nemame " | ||
+ | - Shannon Game | ||
+ | * Pro jednoho hrace. | ||
+ | * Ze stareho svn repozitare vytahnout zdrojak Shannona. | ||
+ | - Place the Space | ||
+ | * Implementovat verzi pro dva hrace. | ||
+ | * Podrobnosti na strance [[Place the space]]. | ||
+ | |||
+ | * **Ukoly pro Jirku** | ||
+ | - Najit Conana Doyla v cestine. (**JM:** Studie v šarlatové nalezeny dvě; první v překladu z roku 1907 (bezpochyby " | ||
+ | - Thajske texty pro PtS. (ani cinstina, ani hindi nejsou vhodnymi kandidaty - bud se tam mezery pisou nebo je to jeste jinak komplikovany). Korpus s mezerama. (//Do 15. unora// - navrhuji vzhledem k deadlinu na IJCNLP 20. kvetna) | ||
+ | - exportovana data z prosincove souteze nachystat tak, abychom je mohli analyzovat (//Do konce unora//) | ||
+ | - vypsat projekty (//Do konce unora//) | ||
+ | * **Ukoly pro Baru** | ||
+ | - sjednotit anglickou a ceskou lokalizaci LGame (//Do konce ledna//) | ||
+ | - promluvit s Nathanem Greenem - on ma rovnez nejake hry, snad i pro Named Entity. (//Do konce ledna//) | ||
+ | - nachystat osnovu clanku do PBMl (//Do konce brezna//, deadline mame na konci kvetna); viz svn '' | ||
+ | - vypsat rocnikove projekty (//Do konce unora//) | ||
+ | - implementace Place the Space pro iPhone a Android | ||
+ | - nova hra: koherence textu: na urovni vety: prehazet poradi slov ve vete, uzivatel rekonstruuje puvodni poradek slov ve vete - implementovat pro iPhone, Android. | ||
+ | * **Ukoly pro Vladimira** | ||
+ | - zmenit proporce na strankach LGame tak, aby uzivatel nemusel scrollovat, aby videl napriklad odkayz pod hlavnim oknem (//Do konce ledna//) | ||
+ | |||
+ | — | ||
+ | * Pro kazdou hru mit automatickou proceduru, ktera se nasadi jako (virtualni) protihrac. | ||
+ | * Nove hry | ||
+ | * Pojmenovane entity - viz [[PlayNE]]. | ||
+ | * Koherence vety/ | ||
+ | * ... | ||
+ | * **Vypsat rocnikove projekty, bakalarky, diplomky!** VOlnost v technologiich, | ||
+ | |||
+ | ==== Prezentace, demonstrace, | ||
+ | * GACR 2012 (po trech neuspesnych pokusech frustrace, ale ... ) | ||
+ | * PBML 96, rozsah: 20 stranek, deadline: May 30, 2011. | ||
+ | * [[http:// | ||
+ | * ... | ||
+ | |||
+ | ==== Finance ==== | ||
+ | - OON | ||
+ | - Jan Kohout, student, 24 tis. | ||
+ | - Vladimir Rovensky, student, 5 tis. | ||
+ | - Sluzby | ||
+ | - Design her, 20 tis. | ||
+ | - Naklady na prezentaci, 20 tis. | ||
+ | - LGame hosting, cca 2 tis. (nevim presne) | ||
+ | |||
+ | ====== Motivation ====== | ||
+ | |||
+ | ===== Games with a purpose (GWAP) ===== | ||
| | ||
| | ||
Line 48: | Line 110: | ||
- | ====== Related initiatives | + | ===== Related initiatives ===== |
| | ||
| | ||
Line 66: | Line 128: | ||
- | ====== Papers to read ====== | + | ===== Papers/ |
* (Snow et al., 2008) [[http:// | * (Snow et al., 2008) [[http:// | ||
* Bara's summary: | * Bara's summary: | ||
Line 74: | Line 136: | ||
* when comparing non-expert and expert annotations, | * when comparing non-expert and expert annotations, | ||
* [[http:// | * [[http:// | ||
+ | | ||
+ | | ||
- | + | ====== | |
- | ====== | + | |
Date: Fri, 10 Oct 2008 09:42:43 +0200, updated on Tue, 7 Apr 2009 | Date: Fri, 10 Oct 2008 09:42:43 +0200, updated on Tue, 7 Apr 2009 | ||
From: Jiří Mírovský | From: Jiří Mírovský | ||
Line 84: | Line 147: | ||
naladit je na jine, mene zabavne lingvisticke hry. | naladit je na jine, mene zabavne lingvisticke hry. | ||
Plus jedna, ktera by uzitecna byt mohla. | Plus jedna, ktera by uzitecna byt mohla. | ||
- | - Hraci dostanou vetu bez mezer mezi slovy a jejich ukolem je nadelat tam mezery, tedy provest tokenizaci. Jediny mozny uplatneni vidim na jazycich jako je thajstina, kde se mezery mezi slovy opravdu nepisou a na konferencich se prednasi o tom, jak to automaticky delat. | + | - Hraci dostanou vetu bez mezer mezi slovy a jejich ukolem je nadelat tam mezery, tedy provest tokenizaci. Jediny mozny uplatneni vidim na jazycich jako je thajstina, kde se mezery mezi slovy opravdu nepisou a na konferencich se prednasi o tom, jak to automaticky delat. |
- Hraci dostanou vetu s prehazenejma slovama (kazdy jinak, nahodne). Jejich cilem je sestavit puvodni vetu. Hraji, dokud se neshodnou, vyhrava ten, kdo to mel driv. Tady uz vubec nevidim zadne vyuziti vlastnich dat, ale mohlo by to fungovat jako reklama na lingvisticke hry, protoze bych rekl, ze tohle hrace bude bavit. Aby to bylo spravedlive, | - Hraci dostanou vetu s prehazenejma slovama (kazdy jinak, nahodne). Jejich cilem je sestavit puvodni vetu. Hraji, dokud se neshodnou, vyhrava ten, kdo to mel driv. Tady uz vubec nevidim zadne vyuziti vlastnich dat, ale mohlo by to fungovat jako reklama na lingvisticke hry, protoze bych rekl, ze tohle hrace bude bavit. Aby to bylo spravedlive, | ||
- Speech reconstruction (nebo jak se tomu odborne rika) - hraci dostanou vetu z rozpoznavace reci a jejich ukolem je udelat z toho standardni ceskou vetu - bez koktani, opakovani apod. | - Speech reconstruction (nebo jak se tomu odborne rika) - hraci dostanou vetu z rozpoznavace reci a jejich ukolem je udelat z toho standardni ceskou vetu - bez koktani, opakovani apod. | ||
- Koherence textu - hráči dostanou text s přeházenými větami - dostanou množinu vět. Cílem je sestavit původní text - seřadit věty. Lucie tvrdí, že to jde vždy, když je text dobře napsaný. Měla na to diplomku. Já tvrdím, že jsou případy, kdy to nejde rozhodnout. Ale hra by z toho mohla být pěkná. | - Koherence textu - hráči dostanou text s přeházenými větami - dostanou množinu vět. Cílem je sestavit původní text - seřadit věty. Lucie tvrdí, že to jde vždy, když je text dobře napsaný. Měla na to diplomku. Já tvrdím, že jsou případy, kdy to nejde rozhodnout. Ale hra by z toho mohla být pěkná. | ||
- | ====== Video ====== | ||
- | | ||
- | | ||
- | ====== | + | * Projit si hry, ktere vydavaji velka vydavatelstvi (Hasbro, ...) a hledat motivaci. |
- | | + | |
- | | + | |
+ | ====== | ||
- | ====== The Project | + | ===== Directory |
Projekt využívá SVN repozitář, | Projekt využívá SVN repozitář, | ||
Line 106: | Line 167: | ||
/ | / | ||
- | ====== Data Format (and Tred Support) for the Project Play the Language | + | ===== Data Format (and Tred Support) for the Project Play the Language ===== |
- | Date: Wed, 24 Dec 2008, updated Tue, 6 Jan 2009, again Fri, 27 Mar 2009 | + | Date: Wed, 24 Dec 2008 |
+ | Updates: | ||
From: Jiří Mírovský | From: Jiří Mírovský | ||
- | ==== Návrh formátu | + | === Formát souborů |
Důvody: | Důvody: | ||
* automatická lemmatizace a morfologická disambiguace textů je uspokojivě zvládnutý problém, pro nás téměř zadarmo | * automatická lemmatizace a morfologická disambiguace textů je uspokojivě zvládnutý problém, pro nás téměř zadarmo | ||
Line 116: | Line 178: | ||
* automatické procedury pro předzpracování textů (např. detekce kandidátů pro koreferenci) budou lemmatizaci a morfologii nejspíš potřebovat | * automatické procedury pro předzpracování textů (např. detekce kandidátů pro koreferenci) budou lemmatizaci a morfologii nejspíš potřebovat | ||
* morfologická rovina jde dobře zobrazit v Tredu | * morfologická rovina jde dobře zobrazit v Tredu | ||
- | ==== Schéma | + | |
- | PML schéma je zde: {ROOT}/ | + | Alternativně používáme také rozšíření a-roviny z PDT 2.0. |
- | * obsahuje | + | |
- | * type - určuje, o jakou koreferenci jde: textual | + | ==== Schémata |
+ | PML schémata jsou zde: {ROOT}/ | ||
+ | * obě schémata (a- i m-) obsahují | ||
+ | * target-node.rf - id antecedenta | ||
+ | * type - určuje, o jakou koreferenci jde: textual, grammatical | ||
* lock - pro účely hry PlayCoref zamyká či odemyká jednotlivé šipky (hodnoty: locked/ | * lock - pro účely hry PlayCoref zamyká či odemyká jednotlivé šipky (hodnoty: locked/ | ||
+ | * dalším rozšířením obou schémat je možnost vkládat informaci o pojmenovaných entitách, a to ve struktuře s těmito atributy: | ||
+ | * last_member.rf - kde pojmenovaná entita končí (začíná na aktuálním uzlu) | ||
+ | * head_member.rf - který uzel je hlavou pojmenované entity | ||
- | ==== Převod dat PDT 2.0 do formátu playlang: | + | === Převod dat PDT 2.0 do formátu playlang: === |
- | V adresáři {ROOT}/ | + | V adresáři {ROOT}/ |
* _change_mschema_to_playlang.sh - změní schéma m-souborů na mdata_schema_playlang.xml | * _change_mschema_to_playlang.sh - změní schéma m-souborů na mdata_schema_playlang.xml | ||
- | * _coreference_extract_surface.ntred - prochází textovou a gramatickou | + | * _change_aschema_to_playlang.sh - změní schéma a-souborů na adata_schema_playlang.xml (m-soubor je pak klasický z PDT 2.0) |
- | * _coreference_add.ntred - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na m-rovině a tyto koreference vkládá do rozšířené m-roviny | + | * coreference_extract_surface_joint.ntred - prochází textovou a gramatickou |
- | * _coreference_lock.ntred - koreferenční šipky opatří správnými hodnotami atributu lock | + | * coreference_extract_surface_a_joint.ntred - totéž, ale pro a-rovinu, tj. vypisují |
+ | * coreference_add_m.ntred - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na m-rovině a tyto koreference vkládá do rozšířené m-roviny | ||
+ | * coreference_add_a.ntred - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na a-rovině a tyto koreference vkládá do rozšířené a-roviny | ||
+ | * coreference_lock.ntred - koreferenční šipky opatří správnými hodnotami atributu lock | ||
- | Aktuálně převedená data jsou v adresáři: {ROOT}/ | + | Aktuálně převedená data jsou v adresáři: {ROOT}/ |
==== Zobrazení v Tredu: ==== | ==== Zobrazení v Tredu: ==== | ||
Pro Tred existuje rozšíření //Play the Language (playlang)//, | Pro Tred existuje rozšíření //Play the Language (playlang)//, | ||
(zdroj: {ROOT}/ | (zdroj: {ROOT}/ | ||
- | Umožňuje otevřít rozšířené m-soubory a zobrazit koreferenční šipky. Nastavuje zobrazení kontextových " | + | Umožňuje otevřít rozšířené m-soubory nebo rozšířené a-soubory a zobrazit koreferenční šipky. Nastavuje zobrazení kontextových " |
Pozor, při otvírání souborů s maskou //*.m.gz// v souborovém dialogu v Tredu je potřeba přepnout filtr souborů na " | Pozor, při otvírání souborů s maskou //*.m.gz// v souborovém dialogu v Tredu je potřeba přepnout filtr souborů na " | ||