Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:playlang [2011/01/20 10:53] ufal |
user:hladka:playlang [2011/01/21 15:38] mirovsky |
||
---|---|---|---|
Line 2: | Line 2: | ||
====== Plan 2011 ====== | ====== Plan 2011 ====== | ||
+ | |||
+ | |||
==== Rekapitulace 2010 ==== | ==== Rekapitulace 2010 ==== | ||
Line 16: | Line 18: | ||
* Jan Kohout (implementace her) | * Jan Kohout (implementace her) | ||
* Vladimir Rovensky (sprava LGame) | * Vladimir Rovensky (sprava LGame) | ||
+ | |||
+ | ==== Schuzky | ||
+ | * 31. ledna, 11:30, chodba k S1 | ||
+ | |||
==== Portal LGame ==== | ==== Portal LGame ==== | ||
Line 21: | Line 27: | ||
- Presun LGame na novy server. Realizace s Milanem Fucikem. (//Do konce ledna//) | - Presun LGame na novy server. Realizace s Milanem Fucikem. (//Do konce ledna//) | ||
* JK: Myslim, ze nam staci Apache server + PHP + PostgreSQL, pro zacatek asi nejlip ve stejne verzi, jako jsou na soucasnem serveru, aby nenastaly nahodou problemy s kompatibilitou. | * JK: Myslim, ze nam staci Apache server + PHP + PostgreSQL, pro zacatek asi nejlip ve stejne verzi, jako jsou na soucasnem serveru, aby nenastaly nahodou problemy s kompatibilitou. | ||
- | - Kliknuti na vlajecku znamena, ze se zobrazi lokalizace odpovidajiciho jazyka (nebo ineho, predem stanoveneho, | + | - Kliknuti na vlajecku znamena, ze se zobrazi lokalizace odpovidajiciho jazyka (nebo jineho, predem stanoveneho, |
* JK: Pridavani novych jazykovych verzi her je uz ted docela dobre navrzene, co se Flashe tyce, tak to nepotrebuje menit program, staci, kdyz se prida dalsi xml s prekladem jednotlivych popisku GUI. V PHP by to take nemelo vyzadovat vetsi zasahy (co se API jednotlivych her tyce). | * JK: Pridavani novych jazykovych verzi her je uz ted docela dobre navrzene, co se Flashe tyce, tak to nepotrebuje menit program, staci, kdyz se prida dalsi xml s prekladem jednotlivych popisku GUI. V PHP by to take nemelo vyzadovat vetsi zasahy (co se API jednotlivych her tyce). | ||
- Na vhodnych forech hledat designera. (Vyvesit inzerat //do konce ledna//) | - Na vhodnych forech hledat designera. (Vyvesit inzerat //do konce ledna//) | ||
Line 37: | Line 43: | ||
* **Ukoly pro Jirku** | * **Ukoly pro Jirku** | ||
- | - Najit Conana Doyla v cestine. (**JM:** Studie v šarlatové | + | - Najit Conana Doyla v cestine. (**JM:** Studie v šarlatové |
- Thajske texty pro PtS. (ani cinstina, ani hindi nejsou vhodnymi kandidaty - bud se tam mezery pisou nebo je to jeste jinak komplikovany). Korpus s mezerama. (//Do 15. unora// - navrhuji vzhledem k deadlinu na IJCNLP 20. kvetna) | - Thajske texty pro PtS. (ani cinstina, ani hindi nejsou vhodnymi kandidaty - bud se tam mezery pisou nebo je to jeste jinak komplikovany). Korpus s mezerama. (//Do 15. unora// - navrhuji vzhledem k deadlinu na IJCNLP 20. kvetna) | ||
- exportovana data z prosincove souteze nachystat tak, abychom je mohli analyzovat (//Do konce unora//) | - exportovana data z prosincove souteze nachystat tak, abychom je mohli analyzovat (//Do konce unora//) | ||
Line 44: | Line 50: | ||
- sjednotit anglickou a ceskou lokalizaci LGame (//Do konce ledna//) | - sjednotit anglickou a ceskou lokalizaci LGame (//Do konce ledna//) | ||
- promluvit s Nathanem Greenem - on ma rovnez nejake hry, snad i pro Named Entity. (//Do konce ledna//) | - promluvit s Nathanem Greenem - on ma rovnez nejake hry, snad i pro Named Entity. (//Do konce ledna//) | ||
- | - nachystat osnovu clanku do PBMl (//Do konce brezna//, deadline mame na konci kvetna) | + | - nachystat osnovu clanku do PBMl (//Do konce brezna//, deadline mame na konci kvetna); viz svn '' |
- vypsat rocnikove projekty (//Do konce unora//) | - vypsat rocnikove projekty (//Do konce unora//) | ||
- implementace Place the Space pro iPhone a Android | - implementace Place the Space pro iPhone a Android | ||
Line 162: | Line 168: | ||
===== Data Format (and Tred Support) for the Project Play the Language ===== | ===== Data Format (and Tred Support) for the Project Play the Language ===== | ||
- | Date: Wed, 24 Dec 2008, updated Tue, 6 Jan 2009, again Fri, 27 Mar 2009 | + | Date: Wed, 24 Dec 2008 |
+ | Updates: | ||
From: Jiří Mírovský | From: Jiří Mírovský | ||
- | === Návrh formátu | + | === Formát souborů |
Důvody: | Důvody: | ||
* automatická lemmatizace a morfologická disambiguace textů je uspokojivě zvládnutý problém, pro nás téměř zadarmo | * automatická lemmatizace a morfologická disambiguace textů je uspokojivě zvládnutý problém, pro nás téměř zadarmo | ||
Line 172: | Line 179: | ||
* morfologická rovina jde dobře zobrazit v Tredu | * morfologická rovina jde dobře zobrazit v Tredu | ||
- | ==== Schéma | + | Alternativně používáme také rozšíření a-roviny z PDT 2.0. |
- | PML schéma je zde: {ROOT}/ | + | |
- | * obsahuje | + | ==== Schémata |
- | * type - určuje, o jakou koreferenci jde: textual | + | PML schémata jsou zde: {ROOT}/ |
+ | * obě schémata (a- i m-) obsahují | ||
+ | * target-node.rf - id antecedenta | ||
+ | * type - určuje, o jakou koreferenci jde: textual, grammatical | ||
* lock - pro účely hry PlayCoref zamyká či odemyká jednotlivé šipky (hodnoty: locked/ | * lock - pro účely hry PlayCoref zamyká či odemyká jednotlivé šipky (hodnoty: locked/ | ||
+ | * dalším rozšířením obou schémat je možnost vkládat informaci o pojmenovaných entitách, a to ve struktuře s těmito atributy: | ||
+ | * last_member.rf - kde pojmenovaná entita končí (začíná na aktuálním uzlu) | ||
+ | * head_member.rf - který uzel je hlavou pojmenované entity | ||
=== Převod dat PDT 2.0 do formátu playlang: === | === Převod dat PDT 2.0 do formátu playlang: === | ||
- | V adresáři {ROOT}/ | + | V adresáři {ROOT}/ |
* _change_mschema_to_playlang.sh - změní schéma m-souborů na mdata_schema_playlang.xml | * _change_mschema_to_playlang.sh - změní schéma m-souborů na mdata_schema_playlang.xml | ||
- | * _coreference_extract_surface.ntred - prochází textovou a gramatickou | + | * _change_aschema_to_playlang.sh - změní schéma a-souborů na adata_schema_playlang.xml (m-soubor je pak klasický z PDT 2.0) |
- | * _coreference_add.ntred - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na m-rovině a tyto koreference vkládá do rozšířené m-roviny | + | * coreference_extract_surface_joint.ntred - prochází textovou a gramatickou |
- | * _coreference_lock.ntred - koreferenční šipky opatří správnými hodnotami atributu lock | + | * coreference_extract_surface_a_joint.ntred - totéž, ale pro a-rovinu, tj. vypisují |
+ | * coreference_add_m.ntred - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na m-rovině a tyto koreference vkládá do rozšířené m-roviny | ||
+ | * coreference_add_a.ntred - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na a-rovině a tyto koreference vkládá do rozšířené a-roviny | ||
+ | * coreference_lock.ntred - koreferenční šipky opatří správnými hodnotami atributu lock | ||
- | Aktuálně převedená data jsou v adresáři: {ROOT}/ | + | Aktuálně převedená data jsou v adresáři: {ROOT}/ |
==== Zobrazení v Tredu: ==== | ==== Zobrazení v Tredu: ==== | ||
Pro Tred existuje rozšíření //Play the Language (playlang)//, | Pro Tred existuje rozšíření //Play the Language (playlang)//, | ||
(zdroj: {ROOT}/ | (zdroj: {ROOT}/ | ||
- | Umožňuje otevřít rozšířené m-soubory a zobrazit koreferenční šipky. Nastavuje zobrazení kontextových " | + | Umožňuje otevřít rozšířené m-soubory nebo rozšířené a-soubory a zobrazit koreferenční šipky. Nastavuje zobrazení kontextových " |
Pozor, při otvírání souborů s maskou //*.m.gz// v souborovém dialogu v Tredu je potřeba přepnout filtr souborů na " | Pozor, při otvírání souborů s maskou //*.m.gz// v souborovém dialogu v Tredu je potřeba přepnout filtr souborů na " | ||