[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
external:pcedt:tr [2007/03/07 09:50]
mikulova
external:pcedt:tr [2008/03/07 11:57]
mikulova
Line 1: Line 1:
 ====== Tektogramatická anotace PCEDT_cz ====== ====== Tektogramatická anotace PCEDT_cz ======
-**Vstup**automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).+Poslední aktualizece7. 3. 2008 
 +Další informace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]]. 
  
  
Line 12: Line 14:
  
 ===== Anotační postup ===== ===== Anotační postup =====
 +**Vstup**: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
 +
 Anotace je rozdělena do pěti po sobě následujících fází: Anotace je rozdělena do pěti po sobě následujících fází:
   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny   - Struktura, funktory a subfunktory, valence, odkazy do a-roviny
Line 18: Line 22:
   - Nodetype, t-lema a gramatémy   - Nodetype, t-lema a gramatémy
   - Uvozovky, name-entities, jiné   - Uvozovky, name-entities, jiné
-Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup.doc}}+Podrobněji: {{:external:pcedt:pcedt_cz_postup.doc|pcedt_cz_postup}}
  
-**:-P 15. 1. 2007 byla zahájena první fáze anotace.**+**:-P 15. 1. 2007 byla zahájena první fáze anotace** (kav, krc). 
 +26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).  
 +Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk).
  
 +Přednostně anotujeme data, která prošla revizí překladu (více [[.done|zde]]).
 +
 +
 +===== Jak jsme daleko =====
 +
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  
  
Line 40: Line 52:
 ===== Pravidla anotace ===== ===== Pravidla anotace =====
     *** Manuál**     *** Manuál**
-      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def.pdf]]+      *  [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|tr_cz_def]]
     *** Dodatky k manuálu**     *** Dodatky k manuálu**
-      * **Seznam dodatků** {{:external:pcedt:addlist3.doc|addlist3.doc}} +      * **Seznam dodatků** {{external:pcedt:addlist8.doc|addlist8}} 
-      * Zkratky {{:external:pcedt:abbrev1.doc|abbrev1.doc}} +      * Zkratky {{:external:pcedt:abbrev1.doc|abbrev1}} 
-      * Anotátorská poznámka {{:external:pcedt:annotcomment2.doc|annotcomment2.doc}} +      * Čísla, čísla, čísla {{:external:pcedt:numbers2.doc|numbers2}} 
-      * Odkazy do a-roviny {{:external:pcedt:aidref11.doc|aidref1.doc}} +      * Spojovník {{:external:pcedt:hyphen1.doc|hyphen1.doc}} 
-      * Elipsy {{:external:pcedt:ellipsis1.doc|ellipsis1.doc}} +      * Anotátorská poznámka {{:external:pcedt:annotcomment2.doc|annotcomment2}} 
-      * Cizí vlastní jména a názvy {{:external:pcedt:foreignname1.doc|foreignname1.doc}} +      * Odkazy do a-roviny {{:external:pcedt:aidref11.doc|aidref1}} 
-      * Různé {{:external:pcedt:misc1.doc|misc1.doc}} +      * Elipsy {{:external:pcedt:ellipsis1.doc|ellipsis1}} 
-      * Zvlášní případy souřadnosti {{:external:pcedt:parataxis1.doc|parataxis1.doc}} +      * Cizí vlastní jména a názvy {{:external:pcedt:foreignname1.doc|foreignname1}} 
-      * Sekundární předložky {{:external:pcedt:secondaryprep1.doc|secondaryprep1.doc}} +      * Různé {{:external:pcedt:misc2.doc|misc2}} 
-      * Segmentace vět do stromů a slov do uzlů {{:external:pcedt:segmentation1.doc|segmentation1.doc}} +      * Zvlášní případy souřadnosti {{:external:pcedt:parataxis2.doc|parataxis2}} 
-      * T-lema {{:external:pcedt:tlema1.doc|tlema1.doc}} +      * Participium trpné {{external:pcedt:participium1.doc|participium1}} 
-      * Chyby v překladu {{:external:pcedt:translation2.doc|translation2.doc}} +      * Sekundární předložky {{:external:pcedt:secondaryprep1.doc|secondaryprep1}} 
-      * Valence sloves {{:external:pcedt:val_verb1.doc|val_verb1.doc}} +      * Segmentace vět do stromů a slov do uzlů {{:external:pcedt:segmentation1.doc|segmentation1}} 
-      * Valence nesloves {{:external:pcedt:val_nonverb1.doc|val_nonverb1.doc}}+      * T-lema {{:external:pcedt:tlema1.doc|tlema1}} 
 +      * Chyby v překladu {{:external:pcedt:translation3.doc|translation3}} 
 +      * Valence sloves {{:external:pcedt:val_verb1.doc|val_verb1}} 
 +      * Valence nesloves {{:external:pcedt:val_nonverb2.doc|val_nonverb2}} 
 +      * Šablony {{:external:pcedt:sablony3.doc|sablony3}} 
     *** Přílohy k manuálu**     *** Přílohy k manuálu**
-      * **Seznam příloh** {{:external:pcedt:applist2.doc|applist2.doc}} +      * **Seznam příloh** {{:external:pcedt:applist2.doc|applist2}} 
-      * Formy u vybraných funktorů {{:external:pcedt:funcforms1.doc|funcforms1.doc}} +      * Formy u vybraných funktorů {{:external:pcedt:funcforms1.doc|funcforms1}} 
-      * Seznam sekundárních předložek {{:external:pcedt:secprep1.doc|secprep1.doc}}+      * Seznam sekundárních předložek {{:external:pcedt:secprep1.doc|secprep1}} 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 +===== TrEd: PML_Cz_T_Anot ===== 
 +Anotujeme v nastavení: 
 +Contex: PML_Cz_T_Anot 
 +Style: PML_T_Anot 
 + 
 +**Dokumenty**: 
 +  * Přehled maker pro PML_T_Anot: {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2}} 
 +  * Uspořádání PDT-vallexu: {{external:pcedt:usporadani_vallexu3.doc|usporadani_vallexu3}} 
 + 
 + 
 + 
 + 
 +===== Kontroly správnosti anotace ===== 
 +Postupně vznikají automatické kontroly správnosti anotace.  
 +Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů.
  
 +Přehled a popis kontrol: {{external:pcedt:prehled_kontrol_070425.doc|prehled_kontrol_070425}}
  
  
Line 66: Line 106:
  
  
-===== Tred: PML_Cz_T_Anot ===== 
-    * Makra - přehled {{:external:pcedt:pml_cz_t_anot_makra2.doc|pml_cz_t_anot_makra2.doc}} 

[ Back to the navigation ] [ Back to the content ]