This is an old revision of the document!
Table of Contents
TO DO
- Ze setkani 28. listopadu 2008
- Pavel: muze zacit s experimenty
- Jirka: Prevod koreference v tektogramatickych stromech anotovanych Anjou a kol. do povrchu. Otazka je do jakeho formatu.
- Bara: najit studenty k implementaci prvnich dvou her z casti 'Ideas'
- Pamatovat si:
- Pracovat s texty v kodovani utf-8.
Games with a purpose (GWAP)
- ontologies (semantic web)
- text (náš LGame)
Related initiatives
- Carolina Parada with Fred Jelinek
- Comments sent to Carolina: TBA
Papers to read
- (Snow et al., 2008) Cheap and Fast - But is it Good? ... , Proceedings of the Conference on Empirical Methods in Natural Language Processing, Waikiki, Honolulu, Hawaii, 2008, pp. TBA.
Ideas
Date: Fri, 10 Oct 2008 09:42:43 +0200
From: Jiří Mírovský
napadly me dve dalsi jazykove hry, ale bohuzel nejsou lingvisticky uzitecne
(nenapada mne, jak ta data vyuzit) - jen by mohly byt zabavne pro hrace a
naladit je na jine, mene zabavne lingvisticke hry.
Plus jedna, ktera by uzitecna byt mohla.
- Hraci dostanou vetu bez mezer mezi slovy a jejich ukolem je nadelat tam mezery, tedy provest tokenizaci. Jediny mozny uplatneni vidim na jazycich jako je thajstina, kde se mezery mezi slovy opravdu nepisou a na konferencich se prednasi o tom, jak to automaticky delat.
- Hraci dostanou vetu s prehazenejma slovama (kazdy jinak, nahodne). Jejich cilem je sestavit puvodni vetu. Hraji, dokud se neshodnou, vyhrava ten, kdo to mel driv. Tady uz vubec nevidim zadne vyuziti vlastnich dat, ale mohlo by to fungovat jako reklama na lingvisticke hry, protoze bych rekl, ze tohle hrace bude bavit. Aby to bylo spravedlive, algoritmus na nahodne prehazeni slov by musel byt chytry, aby to prehazel pro oba hrace ruzne, ale stejne obtizne.
- Speech reconstruction (nebo jak se tomu odborne rika) - hraci dostanou vetu z rozpoznavace reci a jejich ukolem je udelat z toho standardni ceskou vetu - bez koktani, opakovani apod.