This is an old revision of the document!
Table of Contents
Tektogramatická anotace PCEDT_cz
Poslední aktualizace: 18. 3. 2008
Další informace jsou k dispozici na interních stránkách projektu.
Anotační postup
Vstup: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
Anotace je rozdělena do pěti po sobě následujících fází:
- Struktura, funktory a subfunktory, valence, odkazy do a-roviny
- Koreference (kontrola, kvazikontrola, reciprocita)
- Aktuální členění (tfa, pořadí, rematizátory)
- Nodetype, t-lema a gramatémy
- Uvozovky, name-entities, jiné
Podrobněji: pcedt_cz_postup
15. 1. 2007 byla zahájena první fáze anotace (kav, krc).
26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).
Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk).
Přednostně anotujeme data, která prošla revizí překladu (více zde).
Jak jsme daleko
Pravidla anotace
- Manuál
- Dodatky k manuálu
- Seznam dodatků addlist11
- abbrev1Zkratky
- annotcomment3 Anotátorská poznámka
- aidref2 Odkazy do a-roviny
- ellipsis1 Elipsy
- foreignname1 Cizí vlastní jména a názvy
- hyphen1.doc Spojovník
- misc3 Různé
- numbers2 Čísla, čísla, čísla
- participium1 Participium trpné
- parataxis2 Zvlášní případy souřadnosti
- reciprocity1 Reciprocita
- sablony4_prac Šablony
- secondaryprep1 Sekundární předložky
- segmentation1 Segmentace vět do stromů a slov do uzlů
- sesi1 Výrazy se a si
- tlema1 T-lema
- translation4 Chyby v překladu
- val_verb1 Valence sloves
- val_nonverb2 Valence nesloves
- Přílohy k manuálu
- Seznam příloh applist3
- funcforms1 Formy u vybraných funktorů
- secprep2 Seznam sekundárních předložek
- Pracovní materiály
- valramce_080617 Seznam nových valenčních rámců
- note_to_annotation_080630 Poznámky k anotaci
TrEd: PML_Cz_T_Anot
Anotujeme v nastavení:
Contex: PML_Cz_T_Anot
Style: PML_T_Anot
Dokumenty:
- Přehled maker pro PML_T_Anot: pml_cz_t_anot_makra2
- Uspořádání PDT-vallexu: usporadani_vallexu3
Kontroly správnosti anotace
Postupně vznikají automatické kontroly správnosti anotace.
Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů.
Přehled a popis kontrol: prehled_kontrol_080317