[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Tektogramatická anotace PCEDT_cz

Vstup: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).

Anotační postup

Anotace je rozdělena do pěti po sobě následujících fází:

  1. Struktura, funktory a subfunktory, valence, odkazy do a-roviny
  2. Koreference (kontrola, kvazikontrola, reciprocita)
  3. Aktuální členění (tfa, pořadí, rematizátory)
  4. Nodetype, t-lema a gramatémy
  5. Uvozovky, name-entities, jiné

Podrobněji: pcedt_cz_postup.doc

:-P 15. 1. 2007 byla zahájena první fáze anotace.
26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět.
Od 1. 7. 2007 anotujeme ve čtyřech.
Aktuální stav anotace můžete posoudit zde: stav_anotace_070614.xls

Pravidla anotace

Uspořádání PDT-vallexu: usporadani_vallexu3.doc

Tred: PML_Cz_T_Anot

Kontroly správnosti anotace

Postupně vznikají automatické kontroly správnosti anotace.
Opravu již oanotovaných dat provádějí anotátoři zpětně (jednou za dva měsíce) na základě automaticky vygenerovaných filelistů.

Přehled a popis kontrol: prehled_kontrol_070425

Jak jsme daleko

Automaticky generovaný přehled anotovaných souborů


[ Back to the navigation ] [ Back to the content ]