[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Analytická rovina PCEDT_cz

V projektu PCEDT_cz se manuálně anotuje až tektogramatická rovina, analytická rovina byla vytvořena pouze automatickými nástroji. Předpokládáme, že na základě dobře manuálně oanotované tektogramatické roviny budeme moci opět automaticky zatím nedostačně anotovanou analytickou rovinu zpětně doopravit. Pro testování těchto automatických nástrojů bude na analytické rovině manuálně oanotováno cca 2 000 vět.

Data

Manuální anotace bude provedena na cca 2 000 větách, které budou vybrány ze souborů wsj22* a výše.
Přednostně jsou vybírány soubory, které prošly revizí překladu a kterým již existuje manuální tektogramatická anotace.

PML-schéma anotovaných souborů je upraveno tak, aby bylo možné k uzlům vkládat anotátorské poznámky.
Do souborů, ke kterým již existuje tektogramatická anotace, jsou k odpovídajícím a-uzlům z t-roviny přeneseny následující anotátorské poznámky:

TrEd

Contex: PML_A_Anot
Style: PML_A_Anot
Při anotaci se používají stejná anotační makra jako při analytické anotaci korpusu ČAK.
Navíc jsou dvě makra pro anotaci anotátorských poznámek:

Pro kontrolu překladu je v TrEdu zobrazena vedle českého překladu také originální anglická věta.

Pravidla anotace


[ Back to the navigation ] [ Back to the content ]