This is an old revision of the document!
Table of Contents
Tektogramatická anotace PCEDT_cz
Vstup: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
Anotační postup
Anotace je rozdělena do pěti po sobě následujících fází:
- Struktura, funktory a subfunktory, valence, odkazy do a-roviny
- Koreference (kontrola, kvazikontrola, reciprocita)
- Aktuální členění (tfa, pořadí, rematizátory)
- Nodetype, t-lema a gramatémy
- Uvozovky, name-entities, jiné
Podrobněji: pcedt_cz_postup.doc
15. 1. 2007 byla zahájena první fáze anotace.
Pravidla anotace
- Manuál
- Dodatky k manuálu
- Seznam dodatků addlist3.doc
- Zkratky abbrev1.doc
- Anotátorská poznámka annotcomment2.doc
- Odkazy do a-roviny aidref1.doc
- Elipsy ellipsis1.doc
- Cizí vlastní jména a názvy foreignname1.doc
- Různé misc1.doc
- Zvlášní případy souřadnosti parataxis1.doc
- Sekundární předložky secondaryprep1.doc
- Segmentace vět do stromů a slov do uzlů segmentation1.doc
- T-lema tlema1.doc
- Chyby v překladu translation2.doc
- Valence sloves val_verb1.doc
- Valence nesloves val_nonverb1.doc
- Přílohy k manuálu
- Seznam příloh applist2.doc
- Formy u vybraných funktorů funcforms1.doc
- Seznam sekundárních předložek secprep1.doc
Tred: PML_Cz_T_Anot
- Makra - přehled pml_cz_t_anot_makra2.doc
Kontroly správnosti anotace
Postupně vznikají automatické kontroly správnosti anotace.
Opravu již oanotovaných dat provádějí anotátoři zpětně (jednou za měsíc) na základě automaticky vygenerovaných filelistů.
Kontroly jsou uloženy zde:
/net/work/projects/wsj-cz-anot/kontroly/
Přehled a popis kontrol: prehled_kontrol_070314