[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Last revision Both sides next revision
external:pcedt:done [2007/02/13 11:52]
mikulova
external:pcedt:done [2009/12/04 14:16]
mikulova
Line 1: Line 1:
-====== Příprava anotace PCEDT_cz ======+====== Revize a postrevize překladů ====== 
 +Další a podrobnější infromace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]].
  
  
 +Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
  
  
  
  
 +===== Revize překladu =====
 +Do přeložených souborů se zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. 
 +  * Seznam všech souborů určených ke "papírové" korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture}} 
 +Na "papírových" korekturách pracovala Jana Grollová.
  
 +Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. 
 +  * Seznam problematických souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_reviziI}}
 +Tyto revize prováděli: Eva Dubová, Jan Hajič jr., Stáňa Švecová, Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková.
  
 +V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že revize překladu bude provedena **na všech souborech PCEDT_cz** (které doposud nebyly oanotovány).
 +K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí.
 +  * Seznam souborů k revizi ve druhé fázi (jméno souboru - počet vět - počet českých slov) {{:external:pcedt:revize_druhafaze.txt|soubory_k_reviziII}}
 +Tyto revize prováděly: Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková, Blanka Cajthamlová, Mirka Urešová.
  
- +Revize byly slavnostně ukončeny na sušenkovo-kávovo-čajovém posezení 3042009.  
-===== Překlad textů z PennTreebanku  ===== +Poslední zrevidované soubory byly odevzdány 352009.
-Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtinyPoslední přeložený soubor byl odevzdán 111. 2007+
- +
-  * Pokyny k překladu {{:external:pcedt:pokyny.txt|txt}} +
-  * Glosář {{:external:pcedt:glosar.xls|xls}} +
-  * Ukázka {{:external:pcedt:wsj1915.cz.txt|wsj1915.cz.txt}} {{:external:pcedt:wsj1915.en.txt|wsj1915.en.txt}} +
- +
-Textové verze anglických originálů: +
-  /f/project/bh/data/pcedt/en/*.en.txt +
-Textové verze českých překladů (po kontrolních skriptech): +
-  /f/project/bh/4057/section/*/*.cz.txt +
- +
  
  
  
-==== Revize překladu ==== 
-Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu. 
-  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}} 
-  * Aktuální seznam nezrevidovaných souborů {{:external:pcedt:soubory_k_revizi_070210.txt|soubory_k_revizi_070210.txt}} 
  
 +===== Revize revize aneb postrevize =====
  
 +Krátce po zahájení revizí se ukázalo, že i v zrevidovaných souborech je velká řada nedostatků (věcných, pravopisných), které nám při následném zpracování (anotaci) přidělávají spoustu práce, a že je velmi žádoucí tyto nedostatky odstraňovat ještě před tím, než se soubory začnou zpracovávat. Soubory upravené revizorkami se proto od samého začátku ještě jednou kontrolují (zprvu jen Marie Mikulová, pak i Jan Štěpánek).
 +Od května 2009 pracují na postrevizích i dvě "nejlepší" revizorky: Blanka Cajthamlová a Jolana Janoušková.
  
  
  
 +===== Dokumenty =====
 +  * **Pokyny pro překladatele, revizory a korektory**: {{external:pcedt:translation_guidelines_090428.pdf|translation_guidelines_090428}}
 +  * **Glosář**: {{external:pcedt:glosar_090601.xls|glosar_090601}} 
  
-===== Rozšíření PDT-Vallexu ===== 
-Valenční slovník z PDT 2.0 byl doplněn o valenční rámce sloves, která jsou v datech PCEDT_cz a nebyla v datech PDT 2.0. 
  
 +----
  
 +Stav revizí a anotací je možné sledovat zde:
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  

[ Back to the navigation ] [ Back to the content ]