Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
user:hladka:playlang [2011/01/21 15:47] mirovsky |
user:hladka:playlang [2011/01/21 16:00] mirovsky |
| |
Alternativně používáme také rozšíření a-roviny z PDT 2.0. | Alternativně používáme také rozšíření a-roviny z PDT 2.0. |
| |
| Data pro projekt playlang jsou v adresáři: ''{ROOT}/playcoref/data/shared'' |
| |
==== Schémata rozšířené m-roviny a rozšířené a-roviny: ==== | ==== Schémata rozšířené m-roviny a rozšířené a-roviny: ==== |
* ''head_member.rf'' - id uzlu, který je hlavou pojmenované entity | * ''head_member.rf'' - id uzlu, který je hlavou pojmenované entity |
| |
=== Převod dat PDT 2.0 do formátu playlang: === | ==== Převod dat PDT 2.0 (rozšíření bridging) do formátu playlang: ==== |
V adresáři {ROOT}/playcoref/scripts jsou skripty pro převod textové a gramatické koreference z rozšířené tektogramatické roviny projektu bridging do rozšířené m-roviny nebo do rozšířené a-roviny: | V adresáři ''{ROOT}/playcoref/scripts'' jsou skripty pro převod textové a gramatické koreference z rozšířené tektogramatické roviny projektu bridging do rozšířené m-roviny nebo do rozšířené a-roviny: |
| |
== Nejprve se změní schéma souboru (m- nebo a-) == | == Nejprve se změní schéma souboru (m- nebo a-): == |
* ''_change_mschema_to_playlang.sh'' - změní schéma m-souborů na mdata_schema_playlang.xml | * ''_change_mschema_to_playlang.sh'' - změní schéma m-souborů na mdata_schema_playlang.xml |
* ''_change_aschema_to_playlang.sh'' - změní schéma a-souborů na adata_schema_playlang.xml (m-soubor je pak klasický z PDT 2.0) | * ''_change_aschema_to_playlang.sh'' - změní schéma a-souborů na adata_schema_playlang.xml (m-soubor je pak klasický z PDT 2.0) |
| |
== Pak se z rozšířené t-roviny získá seznam koreferenčních dvojic promítnutých na uzly a-roviny nebo m-roviny == | == Pak se z rozšířené t-roviny získá seznam koreferenčních dvojic promítnutých na uzly a-roviny nebo m-roviny: == |
* ''coreference_extract_surface_joint.ntred'' - prochází textovou a gramatickou koreferenci na t-rovině z projektu anotování rozšířené textové koreference a vypíše seznam koreferenčních dvojic - identifikátorů příslušných koreferenčních lemmat na m-rovině; pokud antecedent nemá povrchové vyjádření, hledá se nejbližší antecedent v řetězci, který povrchové vyjádření má | * ''coreference_extract_surface_joint.ntred'' - prochází textovou a gramatickou koreferenci na t-rovině z projektu anotování rozšířené textové koreference a vypíše seznam koreferenčních dvojic - identifikátorů příslušných koreferenčních lemmat na m-rovině; pokud antecedent nemá povrchové vyjádření, hledá se nejbližší antecedent v řetězci, který povrchové vyjádření má |
* ''coreference_extract_surface_a_joint.ntred'' - totéž, ale pro a-rovinu, tj. vypisují se identifikátory a-uzlů odpovídajících koreferenčním dvojicím z t-roviny | * ''coreference_extract_surface_a_joint.ntred'' - totéž, ale pro a-rovinu, tj. vypisují se identifikátory a-uzlů odpovídajících koreferenčním dvojicím z t-roviny |
| |
== Nakonec se koreferenční dvojice z daného seznamu vloží do rozšířeného m-souboru nebo a-souboru == | == Nakonec se koreferenční dvojice z daného seznamu vloží do rozšířeného m-souboru nebo a-souboru: == |
* ''coreference_add_m.ntred'' - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na m-rovině a tyto koreference vkládá do rozšířené m-roviny | * ''coreference_add_m.ntred'' - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na m-rovině a tyto koreference vkládá do rozšířené m-roviny |
* ''coreference_add_a.ntred'' - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na a-rovině a tyto koreference vkládá do rozšířené a-roviny | * ''coreference_add_a.ntred'' - ze seznamu bere dvojice identifikátorů koreferenčních lemmat na a-rovině a tyto koreference vkládá do rozšířené a-roviny |
| |
== Některé koreferenční vztahy je možno zamknout == | == Některé koreferenční vztahy je možno zamknout: == |
* ''coreference_lock.ntred'' - koreferenční šipky opatří správnými hodnotami atributu lock | * ''coreference_lock.ntred'' - koreferenční šipky opatří správnými hodnotami atributu lock |
| |
Aktuálně převedená data jsou v adresáři: ''{ROOT}/playcoref/data/shared'' | === Pojmenované entity === |
| == Nejprve je potřeba získat seznam pojmenovaných entit: == |
| * To se provádí v TectoMT (kde se ostatně pojmenované entity v souborech automaticky označí). Skript pro vytvoření seznamu pojmenovaných entit se jmenuje ''ne_atrees_to_txt.pl'' a nachází se v TectoMT repozitáři v adresáři ''personal/mirovsky/coreference''. |
| |
| == Pojmenované entity z vytvořeného seznamu se vloží do rozšířeného a-souboru (zatím nebyl potřeba skript i pro m-soubor): == |
| * ''named_entities_add_a.ntred'' - ze seznamu bere id uzlů a informaci o pojmenovaných entitách vkládá do rozšířené a- nebo m-roviny |
| |
==== Zobrazení v Tredu: ==== | ==== Zobrazení v Tredu: ==== |