This is an old revision of the document!
Table of Contents
Tektogramatická anotace PCEDT_cz
Vstup: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
Anotační postup
Anotace je rozdělena do pěti po sobě následujících fází:
- Struktura, funktory a subfunktory, valence, odkazy do a-roviny
- Koreference (kontrola, kvazikontrola, reciprocita)
- Aktuální členění (tfa, pořadí, rematizátory)
- Nodetype, t-lema a gramatémy
- Uvozovky, name-entities, jiné
Podrobněji: pcedt_cz_postup
15. 1. 2007 byla zahájena první fáze anotace (kav, krc).
26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).
Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk).
Přednostně anotujeme data, která prošla revizí překladu (více zde).
Jak jsme daleko
Pravidla anotace
- Manuál
- Dodatky k manuálu
- Seznam dodatků addlist8
- Zkratky abbrev1
- Čísla, čísla, čísla numbers2
- Spojovník hyphen1.doc
- Anotátorská poznámka annotcomment2
- Odkazy do a-roviny aidref1
- Elipsy ellipsis1
- Cizí vlastní jména a názvy foreignname1
- Různé misc2
- Zvlášní případy souřadnosti parataxis2
- Participium trpné participium1
- Sekundární předložky secondaryprep1
- Segmentace vět do stromů a slov do uzlů segmentation1
- T-lema tlema1
- Chyby v překladu translation3
- Valence sloves val_verb1
- Valence nesloves val_nonverb2
- Šablony sablony3
- Přílohy k manuálu
- Seznam příloh applist2
- Formy u vybraných funktorů funcforms1
- Seznam sekundárních předložek secprep1
TrEd: PML_Cz_T_Anot
Anotujeme v nastavení:
Contex: PML_Cz_T_Anot
Style: PML_T_Anot
Dokumenty:
- Přehled maker pro PML_T_Anot: pml_cz_t_anot_makra2
- Uspořádání PDT-vallexu: usporadani_vallexu3
Kontroly správnosti anotace
Postupně vznikají automatické kontroly správnosti anotace.
Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů.
Přehled a popis kontrol: prehled_kontrol_070425
Další informace jsou k dispozici na interních stránkách projektu - Interní poznámky.