[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:playcoref [2009/03/17 08:18]
hladka
user:hladka:playcoref [2009/09/24 10:19]
hladka
Line 1: Line 1:
 +====== Play the Language: Play Coreference ======
 +
 +
 +
 +====== Aktuality ======
 +
 +  * Schůzka 24/9/2009
 +     * Sestava: studenti Jan Kohout, Lenka Studničná; badatelé Bára, Jirka, Pavel
 +     * Rozhodnutí:
 +         * Lenka: implementace "vnitřku"
 +         * Honza: implementace rozhraní ve spolupráci se studentkou Helenou Pouchovou
 +         * My: data - zpracování dat ACR a procedurou detekující jmenné entity 
 +      * Termín: 30. října 2009
 +      * Plány: submitnout abstract na demo session na LREC 2010, termín je 31. října 2010
 +
 +
 ====== Motivace ====== ====== Motivace ======
  
Line 96: Line 112:
      - POS tagger      - POS tagger
      - coreference resolution procedure      - coreference resolution procedure
 +
  
  
Line 122: Line 139:
      * **JM**: It would be nice if the players could choose a domain of the texts to play on (science-fiction, fantasy, thriller, romance, ...), maybe even the author or the very title. The available resources of free electronic books in Czech are scarce but there are plenty of free electronic books in English and other languages, e.g. [[http://www.gutenberg.org/wiki/Main_Page|Project Gutenberg]]. **BH**: It is a very nice idea but I would postpone it till the next versions of the PlayCoref game. However, we have already selected more user-friendly texts into the LGame db - see [[http://ufallab2.ms.mff.cuni.cz/lgame/|this page]]. So we can use them for the PlayCoref game as well.       * **JM**: It would be nice if the players could choose a domain of the texts to play on (science-fiction, fantasy, thriller, romance, ...), maybe even the author or the very title. The available resources of free electronic books in Czech are scarce but there are plenty of free electronic books in English and other languages, e.g. [[http://www.gutenberg.org/wiki/Main_Page|Project Gutenberg]]. **BH**: It is a very nice idea but I would postpone it till the next versions of the PlayCoref game. However, we have already selected more user-friendly texts into the LGame db - see [[http://ufallab2.ms.mff.cuni.cz/lgame/|this page]]. So we can use them for the PlayCoref game as well. 
      ***JM (6/3/09)**: Predelal jsem data pro playcoref, ted obsahuji jenom koreference mezi uzly s tagy N nebo P. Data jsou v adresari: ''/net/work/projects/playlang/playcoref/data/02_bridging_playcoref/train-1''. Spocital jsem tabulku, ve ktere jsou tyto soubory z train-1 serazeny sestupne podle pomeru (pocet koref. sipek)/(pocet slov). [[http://ufal.mff.cuni.cz/~hladka/PlayCoref/_text_coref_proportions.txt|Tabulka je tady]] ( prvni sloupec je  pomer (pocet koref. sipek)/(pocet slov), druhy sloupec je nazev souboru, treti sloupec je pocet koref. sipek, ctvrty sloupec je pocet slov.)      ***JM (6/3/09)**: Predelal jsem data pro playcoref, ted obsahuji jenom koreference mezi uzly s tagy N nebo P. Data jsou v adresari: ''/net/work/projects/playlang/playcoref/data/02_bridging_playcoref/train-1''. Spocital jsem tabulku, ve ktere jsou tyto soubory z train-1 serazeny sestupne podle pomeru (pocet koref. sipek)/(pocet slov). [[http://ufal.mff.cuni.cz/~hladka/PlayCoref/_text_coref_proportions.txt|Tabulka je tady]] ( prvni sloupec je  pomer (pocet koref. sipek)/(pocet slov), druhy sloupec je nazev souboru, treti sloupec je pocet koref. sipek, ctvrty sloupec je pocet slov.)
-      ***BH (16/3/09)**. Zajmena filtrovat i podle subPOS: **POVOLIT**:(jejímž), 4 (která), 5, 6, 8 (svýchsvůj), 9 (nimž), E, H, J, K, O, P, S (jejich, našemu), Y.  **ZAMKNOUT**: 7 (zvratné se, si), (totomto), L (všechnyvšech), Q (čím, tím), W (ničehonic), Z+      ***BH (16/3/09)**. Zajmena filtrovat i podle subPOS: **POVOLIT**: 1, 4, 5, 6, 78, 9, H, J, K, P, S  **ZAMKNOUT**: D,E,L, O, Q, W, Y, Z 
    * **EN**    * **EN**
       * search the data that are available; **BH (11/3/09)** Z dokumentace dat, ktera bychom meli mit, jsem nasla MUC6, ale nevidim tam data s koreferenci. Jirka zjisti, jestli jsou nekde jinde nebo jak jinak se k nim muzeme dostat.       * search the data that are available; **BH (11/3/09)** Z dokumentace dat, ktera bychom meli mit, jsem nasla MUC6, ale nevidim tam data s koreferenci. Jirka zjisti, jestli jsou nekde jinde nebo jak jinak se k nim muzeme dostat.
Line 194: Line 211:
  
 ===== Pro toho, kdo bude hru implementovat ===== ===== Pro toho, kdo bude hru implementovat =====
- 
  
 ====== ACL - IJCNLP2009 ====== ====== ACL - IJCNLP2009 ======
Line 200: Line 216:
    * [[http://www.acl-ijcnlp-2009.org/main/callforpapers.html#shortpapers|Short papers]], deadline: April 26, 2009. Predposledni verze clanku musi byt hotova do 12. dubna. Nasledne clanek posleme vybranym kolegum (Fred Jelinek, ....), aby meli na precteni a okomentovani tyden. Nam pak bude zbyvat tyden do terminu.    * [[http://www.acl-ijcnlp-2009.org/main/callforpapers.html#shortpapers|Short papers]], deadline: April 26, 2009. Predposledni verze clanku musi byt hotova do 12. dubna. Nasledne clanek posleme vybranym kolegum (Fred Jelinek, ....), aby meli na precteni a okomentovani tyden. Nam pak bude zbyvat tyden do terminu.
    * pracovni adresar ''/net/work/projects/playlang/doc/ACL-IJCNLP2009/''    * pracovni adresar ''/net/work/projects/playlang/doc/ACL-IJCNLP2009/''
 +   * 23/3/09 - castecne jsem rozmyslela osnovu, podivejte se prosim na to a sve pripominky psat primo do latexovskeho zdrojaku

[ Back to the navigation ] [ Back to the content ]