This is an old revision of the document!
Table of Contents
Tektogramatická anotace PCEDT_cz
Vstup: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
Anotační postup
Anotace je rozdělena do pěti po sobě následujících fází:
- Struktura, funktory a subfunktory, valence, odkazy do a-roviny
- Koreference (kontrola, kvazikontrola, reciprocita)
- Aktuální členění (tfa, pořadí, rematizátory)
- Nodetype, t-lema a gramatémy
- Uvozovky, name-entities, jiné
Podrobněji: pcedt_cz_postup.doc
15. 1. 2007 byla zahájena první fáze anotace.
26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět.
Od 1. 7. 2007 anotujeme ve čtyřech.
Aktuální stav anotace můžete posoudit zde: stav_anotace_070614.xls
Pravidla anotace
- Manuál
- Dodatky k manuálu
- Seznam dodatků addlist8.doc
- Zkratky abbrev1.doc
- Čísla, čísla, čísla numbers2.doc
- Spojovník hyphen1.doc
- Anotátorská poznámka annotcomment2.doc
- Odkazy do a-roviny aidref1.doc
- Elipsy ellipsis1.doc
- Cizí vlastní jména a názvy foreignname1.doc
- Různé misc2.doc
- Zvlášní případy souřadnosti parataxis2.doc
- Participium trpné participium1.doc
- Sekundární předložky secondaryprep1.doc
- Segmentace vět do stromů a slov do uzlů segmentation1.doc
- T-lema tlema1.doc
- Chyby v překladu translation3.doc
- Valence sloves val_verb1.doc
- Valence nesloves val_nonverb2.doc
- Šablony sablony3.doc
- Přílohy k manuálu
- Seznam příloh applist2.doc
- Formy u vybraných funktorů funcforms1.doc
- Seznam sekundárních předložek secprep1.doc
Uspořádání PDT-vallexu: usporadani_vallexu3.doc
Tred: PML_Cz_T_Anot
- Makra - přehled pml_cz_t_anot_makra2.doc
Kontroly správnosti anotace
Postupně vznikají automatické kontroly správnosti anotace.
Opravu již oanotovaných dat provádějí anotátoři zpětně (jednou za měsíc) na základě automaticky vygenerovaných filelistů.
Přehled a popis kontrol: prehled_kontrol_070425