This is an old revision of the document!
Table of Contents
Tektogramatická anotace PCEDT_cz
Další informace jsou k dispozici na interních stránkách projektu.
Anotační postup
Vstup: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
Anotace je rozdělena do pěti po sobě následujících fází:
- Struktura, funktory a subfunktory, valence, odkazy do a-roviny
- Koreference (kontrola, kvazikontrola, reciprocita)
- Aktuální členění (tfa, pořadí, rematizátory)
- Nodetype, t-lema a gramatémy
- Uvozovky, name-entities, jiné
Podrobněji: pcedt_cz_postup
15. 1. 2007 byla zahájena první fáze anotace (kav, krc).
26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).
Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk).
Od 1. 6. 2008 anotuje pět anotátorek (kav, mao,olh, alk, zub).
Od září 2008 anotuje osm anotátorek (kav, mao, olh, alk, mil, leh, jif, ivk).
Přednostně anotujeme data, která prošla revizí překladu (více zde).
Jak jsme daleko
Pravidla anotace
- Manuál
- Dodatky k manuálu
- Stáhnout add
- abbrev1Zkratky
- annotcomment4 Anotátorská poznámka
- aidref3 Odkazy do a-roviny
- ellipsis2r Elipsy
- ext-id-rstr1 EXT-ID-RSTR
- foreignname1 Cizí vlastní jména a názvy
- hyphen1.doc Spojovník
- misc4r Různé
- numbers3r Čísla, čísla, čísla
- participium1 Participium trpné
- parataxis3 Zvlášní případy souřadnosti
- reciprocity2r Reciprocita
- sablony6 Šablony
- secondaryprep1 Sekundární předložky
- segmentation1 Segmentace vět do stromů a slov do uzlů
- sesi1 Výrazy se a si
- syntdphr1 Syntaktické frazeologismy
- tlema2 T-lema
- translation4 Chyby v překladu
- val_verb2 Valence sloves
- val_nonverb3r Valence nesloves
- Přílohy k manuálu
- Stáhnout app
- funcforms1 Formy u vybraných funktorů
- secprep2 Seznam sekundárních předložek
- Pracovní materiály
- valramce_090902 Seznam nových valenčních rámců
- note_to_annotation_080726 Poznámky k anotaci
TrEd: PML_Cz_T_Anot
Anotujeme v nastavení:
Contex: PML_Cz_T_Anot
Style: PML_T_Anot
Dokumenty:
- Přehled maker pro PML_T_Anot: pml_cz_t_anot_makra2
- Uspořádání PDT-vallexu: usporadani_vallexu3
Kontroly správnosti anotace
Postupně vznikají automatické kontroly správnosti anotace.
Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů.
Aktualizace PDT-Vallexu
Dokumenty:
- Instrukce pro přidávání nových rámců do PDT-Vallexu na základě anotátorské poznámky New Valency Frame, obsažených v anotovaných datech (anotátorská poznámka je popsaná v dodatku val_verb) aktualizace_vallexu_090521