[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Plan 2011

Rekapitulace 2010

Tym

Schuzky 2011

Portal LGame

  1. Presun LGame na novy server. Realizace s Milanem Fucikem. (Do konce ledna)
    • JK: Myslim, ze nam staci Apache server + PHP + PostgreSQL, pro zacatek asi nejlip ve stejne verzi, jako jsou na soucasnem serveru, aby nenastaly nahodou problemy s kompatibilitou.
  2. Kliknuti na vlajecku znamena, ze se zobrazi lokalizace odpovidajiciho jazyka (nebo jineho, predem stanoveneho, napr. thajstina –> anglictina). Zaroven to znamena, zase az na vyjimky, ze s texty prislusneho jazyka chce hrac hrat. Proto doplnit vlajecky k demum. (Do 4. unora))
    • JK: Pridavani novych jazykovych verzi her je uz ted docela dobre navrzene, co se Flashe tyce, tak to nepotrebuje menit program, staci, kdyz se prida dalsi xml s prekladem jednotlivych popisku GUI. V PHP by to take nemelo vyzadovat vetsi zasahy (co se API jednotlivych her tyce).
  3. Na vhodnych forech hledat designera. (Vyvesit inzerat do konce ledna)
  4. Zvetsit velikost hracich oken ve spolupraci s Vladimirem. (Do 25. ledna)
  5. Programatorska dokumentace. (Do konce unora)
  6. Export dat ze souteze PlayCoref –> preslat Jirkovi. (Do konce ledna)
  7. Uzivatelske zprijemneni. System by si mel pamatovat, s jaky nastavenim portalu hrac skoncil. Pri naslednem prihlaseni se objevi prave toto nastaveni. (tj. jakou hru, jaky jazyk ma uzivatel rad:-))
  8. Data. Pokud nemame “spolehliva” data, brat vystupy z predchozich partii. Prvni hrac je na tom nejhur, pro nej se pouzije automaticka procedura - zohlednit pri pocitani skore. Spolehlivost anotace. Vyzkouset u PlayCoref.
  9. Shannon Game
    • Pro jednoho hrace.
    • Ze stareho svn repozitare vytahnout zdrojak Shannona.
  10. Place the Space
    • Implementovat verzi pro dva hrace.
    • Podrobnosti na strance Place the space.
  1. Najit Conana Doyla v cestine. (JM: Studie v šarlatové nalezeny dvě; první v překladu z roku 1907 (bezpochyby “free”, ale jazykově spíš nepoužitelná), druhá novější na serveru http://ld.johanesville.net/doyle-06-studie-v-sarlatove?page=1, ale nic tam nepíšou o roku překladu a o autorských právech)
  2. Thajske texty pro PtS. (ani cinstina, ani hindi nejsou vhodnymi kandidaty - bud se tam mezery pisou nebo je to jeste jinak komplikovany). Korpus s mezerama. (Do 15. unora - navrhuji vzhledem k deadlinu na IJCNLP 20. kvetna)
  3. exportovana data z prosincove souteze nachystat tak, abychom je mohli analyzovat (Do konce unora)
  4. vypsat projekty (Do konce unora)
  1. sjednotit anglickou a ceskou lokalizaci LGame (Do konce ledna)
  2. promluvit s Nathanem Greenem - on ma rovnez nejake hry, snad i pro Named Entity. (Do konce ledna)
  3. nachystat osnovu clanku do PBMl (Do konce brezna, deadline mame na konci kvetna); viz svn \playlang_UFAL\doc\papers\2011_PBML_96
  4. vypsat rocnikove projekty (Do konce unora)
    1. implementace Place the Space pro iPhone a Android
    2. nova hra: koherence textu: na urovni vety: prehazet poradi slov ve vete, uzivatel rekonstruuje puvodni poradek slov ve vete - implementovat pro iPhone, Android.
  1. zmenit proporce na strankach LGame tak, aby uzivatel nemusel scrollovat, aby videl napriklad odkayz pod hlavnim oknem (Do konce ledna)

Prezentace, demonstrace, publikace

Finance

  1. OON
    1. Jan Kohout, student, 24 tis.
    2. Vladimir Rovensky, student, 5 tis.
  2. Sluzby
    1. Design her, 20 tis.
  3. Naklady na prezentaci, 20 tis.
  4. LGame hosting, cca 2 tis. (nevim presne)

Motivation

Games with a purpose (GWAP)

Papers/Videos to read/watch

Our ideas

Date: Fri, 10 Oct 2008 09:42:43 +0200, updated on Tue, 7 Apr 2009
From: Jiří Mírovský

napadly me dve dalsi jazykove hry, ale bohuzel nejsou lingvisticky uzitecne
(nenapada me, jak ta data vyuzit) - jen by mohly byt zabavne pro hrace a
naladit je na jine, mene zabavne lingvisticke hry.
Plus jedna, ktera by uzitecna byt mohla.

  1. Hraci dostanou vetu bez mezer mezi slovy a jejich ukolem je nadelat tam mezery, tedy provest tokenizaci. Jediny mozny uplatneni vidim na jazycich jako je thajstina, kde se mezery mezi slovy opravdu nepisou a na konferencich se prednasi o tom, jak to automaticky delat. :-D viz Place the space
  2. Hraci dostanou vetu s prehazenejma slovama (kazdy jinak, nahodne). Jejich cilem je sestavit puvodni vetu. Hraji, dokud se neshodnou, vyhrava ten, kdo to mel driv. Tady uz vubec nevidim zadne vyuziti vlastnich dat, ale mohlo by to fungovat jako reklama na lingvisticke hry, protoze bych rekl, ze tohle hrace bude bavit. Aby to bylo spravedlive, algoritmus na nahodne prehazeni slov by musel byt chytry, aby to prehazel pro oba hrace ruzne, ale stejne obtizne.
  3. Speech reconstruction (nebo jak se tomu odborne rika) - hraci dostanou vetu z rozpoznavace reci a jejich ukolem je udelat z toho standardni ceskou vetu - bez koktani, opakovani apod.
  4. Koherence textu - hráči dostanou text s přeházenými větami - dostanou množinu vět. Cílem je sestavit původní text - seřadit věty. Lucie tvrdí, že to jde vždy, když je text dobře napsaný. Měla na to diplomku. Já tvrdím, že jsou případy, kdy to nejde rozhodnout. Ale hra by z toho mohla být pěkná.

The PlayLang Project

Directory structure

Projekt využívá SVN repozitář, návod k použití zde:
https://svn.ms.mff.cuni.cz/projects/PlayLang

Samotná textová data nejsou ovšem součástí repozitáře (k pracovní kopii se jen přilinkují, viz návod v odkazu výše), k nalezení jsou zde:

/net/projects/playlang_shared

Data Format (and Tred Support) for the Project Play the Language

Date: Wed, 24 Dec 2008
Updates: 6 Jan 2009, 27 Mar 2009, 21 Jan 2011
From: Jiří Mírovský

Formát souborů pro playlang (minimálně playcoref): rozšíření m-roviny z PDT 2.0

Důvody:

Alternativně používáme také rozšíření a-roviny z PDT 2.0.

Data pro projekt playlang jsou v adresáři: {ROOT}/playcoref/data/shared

Schémata rozšířené m-roviny a rozšířené a-roviny:

PML schémata jsou zde: {ROOT}/playcoref/tred_extension/package/playlang/resources

Převod dat PDT 2.0 (rozšíření bridging) do formátu playlang:

V adresáři {ROOT}/playcoref/scripts jsou skripty pro převod textové a gramatické koreference z rozšířené tektogramatické roviny projektu bridging do rozšířené m-roviny nebo do rozšířené a-roviny:

Nejprve se změní schéma souboru (m- nebo a-):
Pak se z rozšířené t-roviny získá seznam koreferenčních dvojic promítnutých na uzly a-roviny nebo m-roviny:
Nakonec se koreferenční dvojice z daného seznamu vloží do rozšířeného m-souboru nebo a-souboru:
Některé koreferenční vztahy je možno zamknout:

Pojmenované entity

Nejprve je potřeba získat seznam pojmenovaných entit:
Pojmenované entity z vytvořeného seznamu se vloží do rozšířeného a-souboru (zatím nebyl potřeba skript i pro m-soubor):

Vkládání dat do herní databáze

Pro vkládání dat do herní databáze používáme formát csts.

Převod rozšířené a-roviny do rozšířeného csts

Zobrazení v Tredu:

Pro Tred existuje rozšíření Play the Language (playlang), nainstalovat lze přes Session→Manage Extensions.
(zdroj: {ROOT}/playcoref/tred_extension)
Umožňuje otevřít rozšířené m-soubory nebo rozšířené a-soubory a zobrazit koreferenční šipky. Nastavuje zobrazení kontextových “stromů” a kontextových vět a v nich zvýrazňuje prvky koreferenčních řetízků, ve kterých se účastní aktuální slovo. Zamčené a nezamčené koreferenční šipky zobrazuje odlišně.
Pozor, při otvírání souborů s maskou *.m.gz v souborovém dialogu v Tredu je potřeba přepnout filtr souborů na “všechny soubory”, aby byly soubory s touto maskou vidět.

Ovládání:
Ctrl+t - zapne/vypne zobrazení šipek koreference a zvýraznění prvků koreferenčních řetízků aktuálního slova v kontextových větách
Alt+p - přepne do čistě morfologického módu - nejsou zobrazeny kontextové “stromy” a věty, nezobrazují se koreferenční šipky
Alt+c - přepne do módu playcoref - zobrazují se kontextové “stromy” a věty, zobrazují se koreferenční šipky i slova

Aktuální uzel lze měnit jak kliknutím na uzel, tak i jednoduchým kliknutím na slovo v kontextových větách.


[ Back to the navigation ] [ Back to the content ]