[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
external:pcedt:tr [2007/03/14 09:44]
mikulova
external:pcedt:tr [2010/04/08 07:36]
mikulova
Line 1: Line 1:
 ====== Tektogramatická anotace PCEDT_cz ====== ====== Tektogramatická anotace PCEDT_cz ======
-**Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).+Další informace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]]. 
 + 
 + 
 + 
  
  
Line 12: Line 16:
  
 ===== Anotační postup ===== ===== Anotační postup =====
 +**Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
 +
 Anotace je rozdělena do pěti po sobě následujících fází: Anotace je rozdělena do pěti po sobě následujících fází:
   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny
Line 18: Line 24:
   - Nodetype, t-lema a gramatémy   - Nodetype, t-lema a gramatémy
   - Uvozovky, name-entities, jiné   - Uvozovky, name-entities, jiné
-Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup.doc}}+Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup}} 
 + 
 +**:-P 15. 1. 2007 byla zahájena první fáze anotace** (kav, krc). 
 +26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).  
 +Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk). 
 +Od 1. 6. 2008 anotuje pět anotátorek (kav, mao,olh, alk, zub). 
 +Od září 2008 anotuje osm anotátorek (kav, mao, olh, alk, mil, leh, jif, ivk).  
 +**V březnu 2010 byl první průchod daty dokončen!!! Hurá!** 
 + 
 +Přednostně anotujeme data, která prošla revizí překladu (více [[.done|zde]]). 
 + 
 + 
 +===== Jak jsme daleko ===== 
 + 
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]] 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
  
-**:-P 15. 1. 2007 byla zahájena první fáze anotace.** 
  
  
Line 40: Line 78:
 ===== Pravidla anotace ===== ===== Pravidla anotace =====
     *** Manuál**     *** Manuál**
-      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def.pdf]]+      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def]]
     *** Dodatky k manuálu**     *** Dodatky k manuálu**
-      * **Seznam dodatků** {{:external:pcedt:addlist3.doc|addlist3.doc}} +      * **Stáhnout** {{external:pcedt:add.zip|add}} 
-      * Zkratky {{:external:pcedt:abbrev1.doc|abbrev1.doc}} +      * {{:external:pcedt:abbrev1.doc|abbrev1}}Zkratky  
-      * Anotátorská poznámka {{:external:pcedt:annotcomment2.doc|annotcomment2.doc}} +      * {{:external:pcedt:annotcomment4.doc|annotcomment4}} Anotátorská poznámka 
-      * Odkazy do a-roviny {{:external:pcedt:aidref11.doc|aidref1.doc}} +      * {{:external:pcedt:aidref3.doc|aidref3}} Odkazy do a-roviny 
-      * Elipsy {{:external:pcedt:ellipsis1.doc|ellipsis1.doc}} +      * {{:external:pcedt:ellipsis2r.doc|ellipsis2r}} Elipsy  
-      * Cizí vlastní jména a názvy {{:external:pcedt:foreignname1.doc|foreignname1.doc}} +      * {{:external:pcedt:ext-id-rstr1.doc|ext-id-rstr1}} EXT-ID-RSTR 
-      * Různé {{:external:pcedt:misc1.doc|misc1.doc}} +      * {{:external:pcedt:foreignname1.doc|foreignname1}} Cizí vlastní jména a názvy 
-      * Zvlášní případy souřadnosti {{:external:pcedt:parataxis1.doc|parataxis1.doc}} +      * {{:external:pcedt:hyphen1.doc|hyphen1.doc}} Spojovník  
-      * Sekundární předložky {{:external:pcedt:secondaryprep1.doc|secondaryprep1.doc}} +      * {{:external:pcedt:misc4r.doc|misc4r}} Různé  
-      * Segmentace vět do stromů a slov do uzlů {{:external:pcedt:segmentation1.doc|segmentation1.doc}} +      * {{:external:pcedt:numbers3r.doc|numbers3r}} Čísla, čísla, čísla 
-      * T-lema {{:external:pcedt:tlema1.doc|tlema1.doc}} +      * {{external:pcedt:participium1.doc|participium1}} Participium trpné 
-      * Chyby v překladu {{:external:pcedt:translation2.doc|translation2.doc}} +      * {{:external:pcedt:parataxis3.doc|parataxis3}} Zvlášní případy souřadnosti  
-      * Valence sloves {{:external:pcedt:val_verb1.doc|val_verb1.doc}} +      * {{:external:pcedt:reciprocity2r.doc|reciprocity2r}} Reciprocita 
-      * Valence nesloves {{:external:pcedt:val_nonverb1.doc|val_nonverb1.doc}}+      * {{:external:pcedt:sablony6.doc|sablony6}} Šablony  
 +      * {{:external:pcedt:secondaryprep1.doc|secondaryprep1}} Sekundární předložky  
 +      * {{:external:pcedt:segmentation1.doc|segmentation1}} Segmentace vět do stromů a slov do uzlů  
 +      * {{:external:pcedt:sesi1.doc|sesi1}} Výrazy //se// a //si// 
 +      * {{:external:pcedt:syntdphr1.doc|syntdphr1}} Syntaktické frazeologismy 
 +      * {{:external:pcedt:tlema2.doc|tlema2}} T-lema 
 +      * {{:external:pcedt:translation4.doc|translation4}} Chyby v překladu  
 +      * {{:external:pcedt:val_verb2.doc|val_verb2}} Valence sloves  
 +      * {{:external:pcedt:val_nonverb3r.doc|val_nonverb3r}} Valence nesloves  
 +       
     *** Přílohy k manuálu**     *** Přílohy k manuálu**
-      * **Seznam příloh** {{:external:pcedt:applist2.doc|applist2.doc}} +      * **Stáhnout** {{:external:pcedt:app.zip|app}} 
-      * Formy u vybraných funktorů {{:external:pcedt:funcforms1.doc|funcforms1.doc}} +      * {{:external:pcedt:funcforms1.doc|funcforms1}} Formy u vybraných funktorů  
-      * Seznam sekundárních předložek {{:external:pcedt:secprep1.doc|secprep1.doc}}+      * {{:external:pcedt:secprep2.doc|secprep2}} Seznam sekundárních předložek  
 + 
 +    *** Pracovní materiály** 
 +      * {{:external:pcedt:valramce_090902.xls|valramce_090902}} Seznam nových valenčních rámců 
 +      * {{:external:pcedt:note_to_annotation_080726.doc|note_to_annotation_080726}} Poznámky k anotaci 
 + 
 + 
 + 
 + 
 + 
 + 
 +===== TrEd: PML_Cz_T_Anot ===== 
 +Anotujeme v nastavení: 
 +Contex: PML_Cz_T_Anot 
 +Style: PML_T_Anot 
 + 
 +**Dokumenty**: 
 +  * Přehled maker pro PML_T_Anot: {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2}} 
 +  * Uspořádání PDT-vallexu: {{external:pcedt:usporadani_vallexu3.doc|usporadani_vallexu3}} 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 +===== Kontroly správnosti anotace ===== 
 +Postupně vznikají automatické kontroly správnosti anotace.  
 +Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů. 
 + 
 +Přehled a popis kontrol: verze 090903 {{external:pcedt:prehled_kontrol_090903.doc|doc}} {{external:pcedt:prehled_kontrol_090903.xls|xls}}
  
  
Line 66: Line 145:
  
  
-===== Tred: PML_Cz_T_Anot ===== 
-    * Makra - přehled {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2.doc}} 
  
-===== Kontroly anotovaných dat =====+===== Aktualizace PDT-Vallexu ===== 
 +Dokumenty: 
 +  * Instrukce pro přidávání nových rámců do PDT-Vallexu na základě anotátorské poznámky //New Valency Frame//, obsažených v anotovaných datech (anotátorská poznámka je popsaná v dodatku val_verb) {{:external:pcedt:aktualizace_vallexu_090521.rtf|aktualizace_vallexu_090521}}
  

[ Back to the navigation ] [ Back to the content ]