====== Tektogramatická anotace PCEDT_cz ====== Další informace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]]. ===== Anotační postup ===== **Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše). Anotace je rozdělena do pěti po sobě následujících fází: - Struktura, funktory a subfunktory, valence, odkazy do a-roviny - Koreference (kontrola, kvazikontrola, reciprocita) - Aktuální členění (tfa, pořadí, rematizátory) - Nodetype, t-lema a gramatémy - Uvozovky, name-entities, jiné Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup}} **:-P 15. 1. 2007 byla zahájena první fáze anotace** (kav, krc). 26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk). Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk). Od 1. 6. 2008 anotuje pět anotátorek (kav, mao,olh, alk, zub). Od září 2008 anotuje osm anotátorek (kav, mao, olh, alk, mil, leh, jif, ivk). **V březnu 2010 byl první průchod daty dokončen!!! Hurá!** Přednostně anotujeme data, která prošla revizí překladu (více [[.done|zde]]). ===== Jak jsme daleko ===== [[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]] ===== Pravidla anotace ===== *** Manuál** * [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def]] *** Dodatky k manuálu** * **Stáhnout** {{external:pcedt:add.zip|add}} * {{:external:pcedt:abbrev1.doc|abbrev1}}Zkratky * {{:external:pcedt:annotcomment4.doc|annotcomment4}} Anotátorská poznámka * {{:external:pcedt:aidref3.doc|aidref3}} Odkazy do a-roviny * {{:external:pcedt:ellipsis2r.doc|ellipsis2r}} Elipsy * {{:external:pcedt:ext-id-rstr1.doc|ext-id-rstr1}} EXT-ID-RSTR * {{:external:pcedt:foreignname1.doc|foreignname1}} Cizí vlastní jména a názvy * {{:external:pcedt:hyphen1.doc|hyphen1.doc}} Spojovník * {{:external:pcedt:misc4r.doc|misc4r}} Různé * {{:external:pcedt:numbers3r.doc|numbers3r}} Čísla, čísla, čísla * {{external:pcedt:participium1.doc|participium1}} Participium trpné * {{:external:pcedt:parataxis3.doc|parataxis3}} Zvlášní případy souřadnosti * {{:external:pcedt:reciprocity2r.doc|reciprocity2r}} Reciprocita * {{:external:pcedt:sablony6.doc|sablony6}} Šablony * {{:external:pcedt:secondaryprep1.doc|secondaryprep1}} Sekundární předložky * {{:external:pcedt:segmentation1.doc|segmentation1}} Segmentace vět do stromů a slov do uzlů * {{:external:pcedt:sesi1.doc|sesi1}} Výrazy //se// a //si// * {{:external:pcedt:syntdphr1.doc|syntdphr1}} Syntaktické frazeologismy * {{:external:pcedt:tlema2.doc|tlema2}} T-lema * {{:external:pcedt:translation4.doc|translation4}} Chyby v překladu * {{:external:pcedt:val_verb2.doc|val_verb2}} Valence sloves * {{:external:pcedt:val_nonverb3r.doc|val_nonverb3r}} Valence nesloves *** Přílohy k manuálu** * **Stáhnout** {{:external:pcedt:app.zip|app}} * {{:external:pcedt:funcforms1.doc|funcforms1}} Formy u vybraných funktorů * {{:external:pcedt:secprep2.doc|secprep2}} Seznam sekundárních předložek *** Pracovní materiály** * {{:external:pcedt:valramce_090902.xls|valramce_090902}} Seznam nových valenčních rámců * {{:external:pcedt:note_to_annotation_080726.doc|note_to_annotation_080726}} Poznámky k anotaci ===== TrEd: PML_Cz_T_Anot ===== Anotujeme v nastavení: Contex: PML_Cz_T_Anot Style: PML_T_Anot **Dokumenty**: * Přehled maker pro PML_T_Anot: {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2}} * Uspořádání PDT-vallexu: {{external:pcedt:usporadani_vallexu3.doc|usporadani_vallexu3}} ===== Kontroly správnosti anotace ===== Postupně vznikají automatické kontroly správnosti anotace. Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů. Přehled a popis kontrol: verze 090903 {{external:pcedt:prehled_kontrol_090903.doc|doc}} {{external:pcedt:prehled_kontrol_090903.xls|xls}} ===== Aktualizace PDT-Vallexu ===== Dokumenty: * Instrukce pro přidávání nových rámců do PDT-Vallexu na základě anotátorské poznámky //New Valency Frame//, obsažených v anotovaných datech (anotátorská poznámka je popsaná v dodatku val_verb) {{:external:pcedt:aktualizace_vallexu_090521.rtf|aktualizace_vallexu_090521}} ===== Administrativa ===== Sazba za odevzdanou práci: 23 Kč/věta. Opravy dat se neproplácí.