[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:pcedt:tr [2008/02/19 20:43]
mikulova
external:pcedt:tr [2010/04/08 07:46] (current)
mikulova
Line 1: Line 1:
 ====== Tektogramatická anotace PCEDT_cz ====== ====== Tektogramatická anotace PCEDT_cz ======
-**Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).+Další informace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]]. 
 + 
 + 
 + 
 + 
  
  
Line 11: Line 16:
  
 ===== Anotační postup ===== ===== Anotační postup =====
 +**Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
 +
 Anotace je rozdělena do pěti po sobě následujících fází: Anotace je rozdělena do pěti po sobě následujících fází:
   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny
Line 17: Line 24:
   - Nodetype, t-lema a gramatémy   - Nodetype, t-lema a gramatémy
   - Uvozovky, name-entities, jiné   - Uvozovky, name-entities, jiné
-Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup.doc}}+Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup}}
  
 **:-P 15. 1. 2007 byla zahájena první fáze anotace** (kav, krc). **:-P 15. 1. 2007 byla zahájena první fáze anotace** (kav, krc).
 26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).  26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk). 
 Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk). Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk).
 +Od 1. 6. 2008 anotuje pět anotátorek (kav, mao,olh, alk, zub).
 +Od září 2008 anotuje osm anotátorek (kav, mao, olh, alk, mil, leh, jif, ivk). 
 +**V březnu 2010 byl první průchod daty dokončen!!! Hurá!**
  
 +Přednostně anotujeme data, která prošla revizí překladu (více [[.done|zde]]).
  
  
Line 29: Line 39:
  
 [[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]] [[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
  
Line 47: Line 78:
 ===== Pravidla anotace ===== ===== Pravidla anotace =====
     *** Manuál**     *** Manuál**
-      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def.pdf]]+      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def]]
     *** Dodatky k manuálu**     *** Dodatky k manuálu**
-      * **Seznam dodatků** {{external:pcedt:addlist8.doc|addlist8.doc}} +      * **Stáhnout** {{external:pcedt:add.zip|add}} 
-      * Zkratky {{:external:pcedt:abbrev1.doc|abbrev1.doc}} +      * {{:external:pcedt:abbrev1.doc|abbrev1}}Zkratky  
-      * Čísla, čísla, čísla {{:external:pcedt:numbers2.doc|numbers2.doc}} +      * {{:external:pcedt:annotcomment4.doc|annotcomment4}} Anotátorská poznámka 
-      * Spojovník {{:external:pcedt:hyphen1.doc|hyphen1.doc}} +      * {{:external:pcedt:aidref3.doc|aidref3}} Odkazy do a-roviny 
-      * Anotátorská poznámka {{:external:pcedt:annotcomment2.doc|annotcomment2.doc}} +      * {{:external:pcedt:ellipsis2r.doc|ellipsis2r}} Elipsy  
-      * Odkazy do a-roviny {{:external:pcedt:aidref11.doc|aidref1.doc}} +      * {{:external:pcedt:ext-id-rstr1.doc|ext-id-rstr1}} EXT-ID-RSTR 
-      * Elipsy {{:external:pcedt:ellipsis1.doc|ellipsis1.doc}} +      * {{:external:pcedt:foreignname1.doc|foreignname1}} Cizí vlastní jména a názvy 
-      * Cizí vlastní jména a názvy {{:external:pcedt:foreignname1.doc|foreignname1.doc}} +      * {{:external:pcedt:hyphen1.doc|hyphen1.doc}} Spojovník  
-      * Různé {{:external:pcedt:misc2.doc|misc2.doc}} +      * {{:external:pcedt:misc4r.doc|misc4r}} Různé  
-      * Zvlášní případy souřadnosti {{:external:pcedt:parataxis2.doc|parataxis2.doc}} +      * {{:external:pcedt:numbers3r.doc|numbers3r}} Čísla, čísla, čísla 
-      * Participium trpné {{external:pcedt:participium1.doc|participium1.doc}} +      * {{external:pcedt:participium1.doc|participium1}} Participium trpné 
-      * Sekundární předložky {{:external:pcedt:secondaryprep1.doc|secondaryprep1.doc}} +      * {{:external:pcedt:parataxis3.doc|parataxis3}} Zvlášní případy souřadnosti  
-      * Segmentace vět do stromů a slov do uzlů {{:external:pcedt:segmentation1.doc|segmentation1.doc}} +      * {{:external:pcedt:reciprocity2r.doc|reciprocity2r}} Reciprocita 
-      * T-lema {{:external:pcedt:tlema1.doc|tlema1.doc}} +      * {{:external:pcedt:sablony6.doc|sablony6}} Šablony  
-      * Chyby v překladu {{:external:pcedt:translation3.doc|translation3.doc}} +      * {{:external:pcedt:secondaryprep1.doc|secondaryprep1}} Sekundární předložky  
-      * Valence sloves {{:external:pcedt:val_verb1.doc|val_verb1.doc}} +      * {{:external:pcedt:segmentation1.doc|segmentation1}} Segmentace vět do stromů a slov do uzlů  
-      * Valence nesloves {{:external:pcedt:val_nonverb2.doc|val_nonverb2.doc}} +      * {{:external:pcedt:sesi1.doc|sesi1}} Výrazy //se// a //si// 
-      * Šablony {{:external:pcedt:sablony3.doc|sablony3.doc}}+      * {{:external:pcedt:syntdphr1.doc|syntdphr1}} Syntaktické frazeologismy 
 +      * {{:external:pcedt:tlema2.doc|tlema2}} T-lema 
 +      * {{:external:pcedt:translation4.doc|translation4}} Chyby v překladu  
 +      * {{:external:pcedt:val_verb2.doc|val_verb2}} Valence sloves  
 +      * {{:external:pcedt:val_nonverb3r.doc|val_nonverb3r}} Valence nesloves  
 +      
  
     *** Přílohy k manuálu**     *** Přílohy k manuálu**
-      * **Seznam příloh** {{:external:pcedt:applist2.doc|applist2.doc}} +      * **Stáhnout** {{:external:pcedt:app.zip|app}} 
-      * Formy u vybraných funktorů {{:external:pcedt:funcforms1.doc|funcforms1.doc}} +      * {{:external:pcedt:funcforms1.doc|funcforms1}} Formy u vybraných funktorů  
-      * Seznam sekundárních předložek {{:external:pcedt:secprep1.doc|secprep1.doc}}+      * {{:external:pcedt:secprep2.doc|secprep2}} Seznam sekundárních předložek 
  
-**Uspořádání PDT-vallexu**{{external:pcedt:usporadani_vallexu3.doc|usporadani_vallexu3.doc}}+    *** Pracovní materiály** 
 +      * {{:external:pcedt:valramce_090902.xls|valramce_090902}} Seznam nových valenčních rámců 
 +      * {{:external:pcedt:note_to_annotation_080726.doc|note_to_annotation_080726}} Poznámky k anotaci
  
  
  
  
-===== Tred: PML_Cz_T_Anot ===== + 
-    Makra - přehled {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2.doc}}+ 
 +===== TrEd: PML_Cz_T_Anot ===== 
 +Anotujeme v nastavení: 
 +Contex: PML_Cz_T_Anot 
 +Style: PML_T_Anot 
 + 
 +**Dokumenty**: 
 +  * Přehled maker pro PML_T_Anot: {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2}} 
 +  * Uspořádání PDT-vallexu: {{external:pcedt:usporadani_vallexu3.doc|usporadani_vallexu3}} 
 + 
  
  
Line 90: Line 138:
 Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů. Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů.
  
-Přehled a popis kontrol: {{external:pcedt:prehled_kontrol_070425.doc|prehled_kontrol_070425}}+Přehled a popis kontrol: verze 090903 {{external:pcedt:prehled_kontrol_090903.doc|doc}} {{external:pcedt:prehled_kontrol_090903.xls|xls}} 
 + 
 + 
 + 
 + 
  
  
 +===== Aktualizace PDT-Vallexu =====
 +Dokumenty:
 +  * Instrukce pro přidávání nových rámců do PDT-Vallexu na základě anotátorské poznámky //New Valency Frame//, obsažených v anotovaných datech (anotátorská poznámka je popsaná v dodatku val_verb) {{:external:pcedt:aktualizace_vallexu_090521.rtf|aktualizace_vallexu_090521}}
  
 +===== Administrativa =====
 +Sazba za odevzdanou práci: 23 Kč/věta.
 +Opravy dat se neproplácí.
  

[ Back to the navigation ] [ Back to the content ]