[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:pcedt:ar [2008/06/11 11:48]
mikulova
external:pcedt:ar [2009/05/11 16:30] (current)
mikulova
Line 1: Line 1:
 ====== Analytická rovina PCEDT_cz ====== ====== Analytická rovina PCEDT_cz ======
 V projektu PCEDT_cz se manuálně anotuje až tektogramatická rovina, analytická rovina byla vytvořena pouze automatickými nástroji. Předpokládáme, že na základě dobře manuálně oanotované tektogramatické roviny budeme moci opět automaticky zatím nedostačně anotovanou analytickou rovinu zpětně doopravit. Pro testování těchto automatických nástrojů bude na analytické rovině manuálně oanotováno cca 2 000 vět. V projektu PCEDT_cz se manuálně anotuje až tektogramatická rovina, analytická rovina byla vytvořena pouze automatickými nástroji. Předpokládáme, že na základě dobře manuálně oanotované tektogramatické roviny budeme moci opět automaticky zatím nedostačně anotovanou analytickou rovinu zpětně doopravit. Pro testování těchto automatických nástrojů bude na analytické rovině manuálně oanotováno cca 2 000 vět.
 +
 +Anotace byla provedena v červnu a v červenci 2008 anotátorkou Ivanou Klímovou.
 +
 +
  
  
Line 6: Line 10:
 Manuální anotace bude provedena na cca 2 000 větách, které budou vybrány ze souborů wsj22* a výše. Manuální anotace bude provedena na cca 2 000 větách, které budou vybrány ze souborů wsj22* a výše.
 Přednostně jsou vybírány soubory, které prošly revizí překladu a kterým již existuje manuální tektogramatická anotace. Přednostně jsou vybírány soubory, které prošly revizí překladu a kterým již existuje manuální tektogramatická anotace.
 +
 +PML-schéma anotovaných souborů je upraveno tak, aby bylo možné k uzlům vkládat anotátorské poznámky. 
 +Do souborů, ke kterým již existuje tektogramatická anotace, jsou k odpovídajícím a-uzlům z t-roviny přeneseny následující anotátorské poznámky:  
 +   * M-lemma
 +   * M-tag
 +   * Typo
 +   * Word segmentation
 +   * Sentence segmentation
 +   * Translation
 +   * Re-generate
 +
 +
 +
 +
 +
 +
 +
 +
  
  
 ===== TrEd ===== ===== TrEd =====
-Contex: +Contex: ''PML_A_Anot'' 
-Style:+Style: ''PML_A_Anot''
 Při anotaci se používají stejná anotační makra jako při analytické anotaci korpusu ČAK. Při anotaci se používají stejná anotační makra jako při analytické anotaci korpusu ČAK.
 Navíc jsou dvě makra pro anotaci anotátorských poznámek: Navíc jsou dvě makra pro anotaci anotátorských poznámek:

[ Back to the navigation ] [ Back to the content ]