[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:pcedt:done [2007/05/17 10:16]
mikulova
external:pcedt:done [2009/12/04 14:18] (current)
mikulova
Line 1: Line 1:
-====== Příprava anotace PCEDT_cz ======+====== Revize a postrevize překladů ====== 
 +Další a podrobnější infromace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]].
  
  
- 
- 
- 
- 
- 
- 
- 
- 
- 
-===== Překlad textů z PennTreebanku  ===== 
 Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007. Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
- 
-**Pokyny pro překladatele, revizory a korektory**: {{external:pcedt:translation_guidelines3.doc|translation_guidelines3.doc}} 
- 
-Textové verze anglických originálů: 
-  /f/project/bh/data/pcedt/en/*.en.txt 
-Textové verze českých překladů (po kontrolních skriptech): 
-  /f/project/bh/4057/section/*/*.cz.txt 
- 
- 
- 
- 
  
  
  
  
 +===== Revize překladu =====
 +Do přeložených souborů se zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. 
 +  * Seznam všech souborů určených ke "papírové" korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture}} 
 +Na "papírových" korekturách pracovala Jana Grollová.
  
-==== Revize překladu ==== +Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642.  
-Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu+  * Seznam problematických souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_reviziI}} 
-  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}} +Tyto revize prováděliEva Dubová, Jan Hajič jr., Stáňa Švecová, Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková.
-  * Aktuální seznam nezrevidovaných souborů {{external:pcedt:soubory_k_revizi_070418.txt|soubory_k_revizi_070418.txt}}+
  
-Na revizi překladu pracuje:   +V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že revize překladu bude provedena **na všech souborech PCEDT_cz** (které doposud nebyly oanotovány). 
-  Stanislava Švecová +K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí. 
-  * Eva Dubová+  * Seznam souborů k revizi ve druhé fázi (jméno souboru - počet vět - počet českých slov) {{:external:pcedt:revize_druhafaze.txt|soubory_k_reviziII}} 
 +Tyto revize prováděly: Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková, Blanka Cajthamlová, Mirka Urešová.
  
 +Revize byly slavnostně ukončeny na sušenkovo-kávovo-čajovém posezení 30. 4. 2009. 
 +Poslední zrevidované soubory byly odevzdány 3. 5. 2009.
  
  
Line 43: Line 29:
  
  
-==== Korektura překladu ==== +===== Revize revize aneb postrevize =====
-Do souborů se též zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. +
-  * Seznam všech souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture.txt}}  +
-  * Aktuální seznam souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture_070516.txt|ke_korekture_070516.doc}}+
  
-Na korektuře překladu pracuje:    +Krátce po zahájení revizí se ukázalo, že i v zrevidovaných souborech je velká řada nedostatků (věcných, pravopisných), které nám při následném zpracování (anotaci) přidělávají spoustu práce, a žje velmi žádoucí tyto nedostatky odstraňovat ještě ed tím, než se soubory začnou zpracovávat. Soubory upravené revizorkami se proto od samého začátku ještě jednou kontrolují (zprvu jen Marie Mikulová, pak i Jan Štěpánek). 
-  * Jana Grollová+Od května 2009 (tj. po ukončení revizí) pracují na postrevizích i dvě "nejlepší" revizorky: Blanka Cajthamlová a Jolana Janoušková. Od listopadu 2009 pak i Eva Štěpánková (posilu bylo nutné přibrat proto, že revizorky nestačí anotátorům).
  
  
  
 +===== Dokumenty =====
 +  * **Pokyny pro překladatele, revizory a korektory**: {{external:pcedt:translation_guidelines_090428.pdf|translation_guidelines_090428}}
 +  * **Glosář**: {{external:pcedt:glosar_090601.xls|glosar_090601}} 
  
-===== Rozšíření PDT-Vallexu ===== 
-Valenční slovník z PDT 2.0 byl doplněn o valenční rámce sloves, která jsou v datech PCEDT_cz a nebyla v datech PDT 2.0. 
  
 +----
  
 +Stav revizí a anotací je možné sledovat zde:
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  

[ Back to the navigation ] [ Back to the content ]