[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:pcedt:tr [2007/05/29 13:09]
mikulova
external:pcedt:tr [2010/04/08 07:46] (current)
mikulova
Line 1: Line 1:
 ====== Tektogramatická anotace PCEDT_cz ====== ====== Tektogramatická anotace PCEDT_cz ======
-**Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše). +Další informace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]].
  
  
Line 17: Line 16:
  
 ===== Anotační postup ===== ===== Anotační postup =====
 +**Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
 +
 Anotace je rozdělena do pěti po sobě následujících fází: Anotace je rozdělena do pěti po sobě následujících fází:
   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny
Line 23: Line 24:
   - Nodetype, t-lema a gramatémy   - Nodetype, t-lema a gramatémy
   - Uvozovky, name-entities, jiné   - Uvozovky, name-entities, jiné
-Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup.doc}}+Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup}} 
 + 
 +**:-P 15. 1. 2007 byla zahájena první fáze anotace** (kav, krc). 
 +26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).  
 +Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk). 
 +Od 1. 6. 2008 anotuje pět anotátorek (kav, mao,olh, alk, zub). 
 +Od září 2008 anotuje osm anotátorek (kav, mao, olh, alk, mil, leh, jif, ivk).  
 +**V březnu 2010 byl první průchod daty dokončen!!! Hurá!** 
 + 
 +Přednostně anotujeme data, která prošla revizí překladu (více [[.done|zde]]). 
 + 
 + 
 +===== Jak jsme daleko ===== 
 + 
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]] 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
  
-**:-P 15. 1. 2007 byla zahájena první fáze anotace.** 
-26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět.  
-**Aktuální stav anotace můžete posoudit zde**: {{external:pcedt:stav_anotace_070516.xls|stav_anotace_070514.xls}} 
  
  
Line 50: Line 78:
 ===== Pravidla anotace ===== ===== Pravidla anotace =====
     *** Manuál**     *** Manuál**
-      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def.pdf]]+      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def]]
     *** Dodatky k manuálu**     *** Dodatky k manuálu**
-      * **Seznam dodatků** {{external:pcedt:addlist7.doc|addlist7.doc}} +      * **Stáhnout** {{external:pcedt:add.zip|add}} 
-      * Zkratky {{:external:pcedt:abbrev1.doc|abbrev1.doc}} +      * {{:external:pcedt:abbrev1.doc|abbrev1}}Zkratky  
-      * Anotátorská poznámka {{:external:pcedt:annotcomment2.doc|annotcomment2.doc}} +      * {{:external:pcedt:annotcomment4.doc|annotcomment4}} Anotátorská poznámka 
-      * Odkazy do a-roviny {{:external:pcedt:aidref11.doc|aidref1.doc}} +      * {{:external:pcedt:aidref3.doc|aidref3}} Odkazy do a-roviny 
-      * Elipsy {{:external:pcedt:ellipsis1.doc|ellipsis1.doc}} +      * {{:external:pcedt:ellipsis2r.doc|ellipsis2r}} Elipsy  
-      * Cizí vlastní jména a názvy {{:external:pcedt:foreignname1.doc|foreignname1.doc}} +      * {{:external:pcedt:ext-id-rstr1.doc|ext-id-rstr1}} EXT-ID-RSTR 
-      * Různé {{:external:pcedt:misc2.doc|misc2.doc}} +      * {{:external:pcedt:foreignname1.doc|foreignname1}} Cizí vlastní jména a názvy 
-      * Zvlášní případy souřadnosti {{:external:pcedt:parataxis2.doc|parataxis2.doc}} +      * {{:external:pcedt:hyphen1.doc|hyphen1.doc}} Spojovník  
-      * Participium trpné {{external:pcedt:participium1.doc|participium1.doc}} +      * {{:external:pcedt:misc4r.doc|misc4r}} Různé  
-      * Sekundární předložky {{:external:pcedt:secondaryprep1.doc|secondaryprep1.doc}} +      * {{:external:pcedt:numbers3r.doc|numbers3r}} Čísla, čísla, čísla 
-      * Segmentace vět do stromů a slov do uzlů {{:external:pcedt:segmentation1.doc|segmentation1.doc}} +      * {{external:pcedt:participium1.doc|participium1}} Participium trpné 
-      * T-lema {{:external:pcedt:tlema1.doc|tlema1.doc}} +      * {{:external:pcedt:parataxis3.doc|parataxis3}} Zvlášní případy souřadnosti  
-      * Chyby v překladu {{:external:pcedt:translation2.doc|translation2.doc}} +      * {{:external:pcedt:reciprocity2r.doc|reciprocity2r}} Reciprocita 
-      * Valence sloves {{:external:pcedt:val_verb1.doc|val_verb1.doc}} +      * {{:external:pcedt:sablony6.doc|sablony6}} Šablony  
-      * Valence nesloves {{:external:pcedt:val_nonverb2.doc|val_nonverb2.doc}} +      * {{:external:pcedt:secondaryprep1.doc|secondaryprep1}} Sekundární předložky  
-      * Šablony {{:external:pcedt:sablony2.doc|sablony2.doc}}+      * {{:external:pcedt:segmentation1.doc|segmentation1}} Segmentace vět do stromů a slov do uzlů  
 +      * {{:external:pcedt:sesi1.doc|sesi1}} Výrazy //se// a //si// 
 +      * {{:external:pcedt:syntdphr1.doc|syntdphr1}} Syntaktické frazeologismy 
 +      * {{:external:pcedt:tlema2.doc|tlema2}} T-lema 
 +      * {{:external:pcedt:translation4.doc|translation4}} Chyby v překladu  
 +      * {{:external:pcedt:val_verb2.doc|val_verb2}} Valence sloves  
 +      * {{:external:pcedt:val_nonverb3r.doc|val_nonverb3r}} Valence nesloves  
 +      
  
     *** Přílohy k manuálu**     *** Přílohy k manuálu**
-      * **Seznam příloh** {{:external:pcedt:applist2.doc|applist2.doc}} +      * **Stáhnout** {{:external:pcedt:app.zip|app}} 
-      * Formy u vybraných funktorů {{:external:pcedt:funcforms1.doc|funcforms1.doc}} +      * {{:external:pcedt:funcforms1.doc|funcforms1}} Formy u vybraných funktorů  
-      * Seznam sekundárních předložek {{:external:pcedt:secprep1.doc|secprep1.doc}}+      * {{:external:pcedt:secprep2.doc|secprep2}} Seznam sekundárních předložek 
  
-**Uspořádání PDT-vallexu**: {{external:pcedt:usporadani_vallexu3.doc|usporadani_vallexu3.doc}}+    *** Pracovní materiály** 
 +      * {{:external:pcedt:valramce_090902.xls|valramce_090902}} Seznam nových valenčních rámců 
 +      * {{:external:pcedt:note_to_annotation_080726.doc|note_to_annotation_080726}} Poznámky k anotaci 
 + 
 + 
 + 
 + 
 + 
 + 
 +===== TrEd: PML_Cz_T_Anot ===== 
 +Anotujeme v nastavení: 
 +Contex: PML_Cz_T_Anot 
 +Style: PML_T_Anot 
 + 
 +**Dokumenty**: 
 +  * Přehled maker pro PML_T_Anot: {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2}} 
 +  * Uspořádání PDT-vallexu: {{external:pcedt:usporadani_vallexu3.doc|usporadani_vallexu3}}
  
  
  
  
-===== Tred: PML_Cz_T_Anot ===== 
-    * Makra - přehled {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2.doc}} 
  
  
Line 87: Line 136:
 ===== Kontroly správnosti anotace ===== ===== Kontroly správnosti anotace =====
 Postupně vznikají automatické kontroly správnosti anotace.  Postupně vznikají automatické kontroly správnosti anotace. 
-Opravu již oanotovaných dat provádějí anotátoři zpětně (jednou za měsíc) na základě automaticky vygenerovaných filelistů.+Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů
 + 
 +Přehled a popis kontrol: verze 090903 {{external:pcedt:prehled_kontrol_090903.doc|doc}} {{external:pcedt:prehled_kontrol_090903.xls|xls}} 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 +===== Aktualizace PDT-Vallexu ===== 
 +Dokumenty: 
 +  * Instrukce pro přidávání nových rámců do PDT-Vallexu na základě anotátorské poznámky //New Valency Frame//, obsažených v anotovaných datech (anotátorská poznámka je popsaná v dodatku val_verb) {{:external:pcedt:aktualizace_vallexu_090521.rtf|aktualizace_vallexu_090521}} 
 + 
 +===== Administrativa ===== 
 +Sazba za odevzdanou práci: 23 Kč/věta. 
 +Opravy dat se neproplácí.
  
-Přehled a popis kontrol: {{external:pcedt:prehled_kontrol_070425.doc|prehled_kontrol_070425}} 

[ Back to the navigation ] [ Back to the content ]