[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

HOT ISSUES

—-

—-

Games with a purpose (GWAP)

Related initiatives

Papers to read

Ideas

Date: Fri, 10 Oct 2008 09:42:43 +0200
From: Jiří Mírovský

napadly me dve dalsi jazykove hry, ale bohuzel nejsou lingvisticky uzitecne
(nenapada mne, jak ta data vyuzit) - jen by mohly byt zabavne pro hrace a
naladit je na jine, mene zabavne lingvisticke hry.
Plus jedna, ktera by uzitecna byt mohla.

  1. Hraci dostanou vetu bez mezer mezi slovy a jejich ukolem je nadelat tam mezery, tedy provest tokenizaci. Jediny mozny uplatneni vidim na jazycich jako je thajstina, kde se mezery mezi slovy opravdu nepisou a na konferencich se prednasi o tom, jak to automaticky delat.
  2. Hraci dostanou vetu s prehazenejma slovama (kazdy jinak, nahodne). Jejich cilem je sestavit puvodni vetu. Hraji, dokud se neshodnou, vyhrava ten, kdo to mel driv. Tady uz vubec nevidim zadne vyuziti vlastnich dat, ale mohlo by to fungovat jako reklama na lingvisticke hry, protoze bych rekl, ze tohle hrace bude bavit. Aby to bylo spravedlive, algoritmus na nahodne prehazeni slov by musel byt chytry, aby to prehazel pro oba hrace ruzne, ale stejne obtizne.
  3. Speech reconstruction (nebo jak se tomu odborne rika) - hraci dostanou vetu z rozpoznavace reci a jejich ukolem je udelat z toho standardni ceskou vetu - bez koktani, opakovani apod.

Video

Corpora outside their original context

The Project Directory

/net/work/projects/playlang/

Data Format (and Tred Support) for the Project Play the Language

Date: Wed, 24 Dec 2008, updated Tue, 6 Jan 2009
From: Jiří Mírovský

Důvody:

Schéma rozšířené m-roviny:

{ROOT}/playcoref/tred_extension/mdata_schema_playlang.xml

Převod dat PDT 2.0 do formátu playlang:

V adresáři /net/work/projects/playlang/playcoref/data/scripts jsou skripty pro převod textové koreference z tektogramatické roviny do rozšířené m-roviny:

Převedl jsem data z projektu anotování rozšířené koreference do rozšířené m-roviny. K dispozici jsou data train-1:
/net/work/projects/playlang/playcoref/data/files/02_bridging_playcoref/train-1

Zobrazení v Tredu:

Pro Tred existuje rozšíření Play the Language (playlang), nainstalovat lze přes Session→Manage Extensions.
(zdroj: /net/work/projects/playlang/playcoref/tred_extension/playlang.mac)
Umožňuje otevřít rozšířené m-soubory a zobrazit koreferenční šipky. Nastavuje zobrazení kontextových “stromů” a kontextových vět a v nich zvýrazňuje prvky koreferenčních řetízků, ve kterých se účastní aktuální slovo.
Pozor, při otvírání souborů s maskou *.m.gz v souborovém dialogu v Tredu je potřeba přepnout filtr souborů na “všechny soubory”, aby byly soubory s touto maskou vidět.

Ovládání:
Ctrl+t - zapne/vypne zobrazení šipek textové koreference a zvýraznění prvků koreferenčních řetízků aktuálního slova v kontextových větách
Alt+p - přepne do čistě morfologického módu - nejsou zobrazeny kontextové “stromy” a věty, nezobrazují se koreferenční šipky
Alt+c - přepne do módu playcoref - zobrazují se kontextové “stromy” a věty, zobrazují se koreferenční šipky i slova

Aktuální uzel lze měnit jak kliknutím na uzel, tak i jednoduchým kliknutím na slovo v kontextových větách.


[ Back to the navigation ] [ Back to the content ]