[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:pcedt:done [2007/05/17 10:07]
mikulova
external:pcedt:done [2009/12/04 14:18] (current)
mikulova
Line 1: Line 1:
-====== Příprava anotace PCEDT_cz ======+====== Revize a postrevize překladů ====== 
 +Další a podrobnější infromace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]].
  
  
 +Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
  
  
  
  
 +===== Revize překladu =====
 +Do přeložených souborů se zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. 
 +  * Seznam všech souborů určených ke "papírové" korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture}} 
 +Na "papírových" korekturách pracovala Jana Grollová.
  
 +Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. 
 +  * Seznam problematických souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_reviziI}}
 +Tyto revize prováděli: Eva Dubová, Jan Hajič jr., Stáňa Švecová, Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková.
  
 +V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že revize překladu bude provedena **na všech souborech PCEDT_cz** (které doposud nebyly oanotovány).
 +K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí.
 +  * Seznam souborů k revizi ve druhé fázi (jméno souboru - počet vět - počet českých slov) {{:external:pcedt:revize_druhafaze.txt|soubory_k_reviziII}}
 +Tyto revize prováděly: Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková, Blanka Cajthamlová, Mirka Urešová.
  
 +Revize byly slavnostně ukončeny na sušenkovo-kávovo-čajovém posezení 30. 4. 2009. 
 +Poslední zrevidované soubory byly odevzdány 3. 5. 2009.
  
-===== Překlad textů z PennTreebanku  ===== 
-Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007. 
  
-  * Pokyny k překladu {{:external:pcedt:pokyny.txt|txt}} 
-  * Glosář {{:external:pcedt:glosar.xls|xls}} 
-  * Ukázka {{:external:pcedt:wsj1915.cz.txt|wsj1915.cz.txt}} {{:external:pcedt:wsj1915.en.txt|wsj1915.en.txt}} 
  
-Textové verze anglických originálů: 
-  /f/project/bh/data/pcedt/en/*.en.txt 
-Textové verze českých překladů (po kontrolních skriptech): 
-  /f/project/bh/4057/section/*/*.cz.txt 
  
  
 +===== Revize revize aneb postrevize =====
  
 +Krátce po zahájení revizí se ukázalo, že i v zrevidovaných souborech je velká řada nedostatků (věcných, pravopisných), které nám při následném zpracování (anotaci) přidělávají spoustu práce, a že je velmi žádoucí tyto nedostatky odstraňovat ještě před tím, než se soubory začnou zpracovávat. Soubory upravené revizorkami se proto od samého začátku ještě jednou kontrolují (zprvu jen Marie Mikulová, pak i Jan Štěpánek).
 +Od května 2009 (tj. po ukončení revizí) pracují na postrevizích i dvě "nejlepší" revizorky: Blanka Cajthamlová a Jolana Janoušková. Od listopadu 2009 pak i Eva Štěpánková (posilu bylo nutné přibrat proto, že revizorky nestačí anotátorům).
  
  
  
 +===== Dokumenty =====
 +  * **Pokyny pro překladatele, revizory a korektory**: {{external:pcedt:translation_guidelines_090428.pdf|translation_guidelines_090428}}
 +  * **Glosář**: {{external:pcedt:glosar_090601.xls|glosar_090601}} 
  
- 
-==== Revize překladu ==== 
-Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu. 
-  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}} 
-  * Aktuální seznam nezrevidovaných souborů {{external:pcedt:soubory_k_revizi_070410.txt|soubory_k_revizi_070410.txt}} 
- 
- 
- 
- 
-==== Korektura překladu ==== 
-Do souborů se též zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. 
-  * Seznam všech souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture.txt}}  
-  * Aktuální seznam souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture_070516.txt|ke_korekture_070516.doc}} 
  
 ---- ----
-**Pokyny pro překladatele, revizory a korektory**: {{external:pcedt:translation_guidelines3.doc|translation_guidelines3.doc}} 
- 
- 
-===== Rozšíření PDT-Vallexu ===== 
-Valenční slovník z PDT 2.0 byl doplněn o valenční rámce sloves, která jsou v datech PCEDT_cz a nebyla v datech PDT 2.0. 
- 
  
 +Stav revizí a anotací je možné sledovat zde:
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  

[ Back to the navigation ] [ Back to the content ]