[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
external:pcedt:done [2007/03/30 12:37]
mikulova
external:pcedt:done [2009/12/04 14:16]
mikulova
Line 1: Line 1:
-====== Příprava anotace PCEDT_cz ======+====== Revize a postrevize překladů ====== 
 +Další a podrobnější infromace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]].
  
  
 +Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
  
  
  
  
 +===== Revize překladu =====
 +Do přeložených souborů se zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. 
 +  * Seznam všech souborů určených ke "papírové" korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture}} 
 +Na "papírových" korekturách pracovala Jana Grollová.
  
 +Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. 
 +  * Seznam problematických souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_reviziI}}
 +Tyto revize prováděli: Eva Dubová, Jan Hajič jr., Stáňa Švecová, Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková.
  
 +V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že revize překladu bude provedena **na všech souborech PCEDT_cz** (které doposud nebyly oanotovány).
 +K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí.
 +  * Seznam souborů k revizi ve druhé fázi (jméno souboru - počet vět - počet českých slov) {{:external:pcedt:revize_druhafaze.txt|soubory_k_reviziII}}
 +Tyto revize prováděly: Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková, Blanka Cajthamlová, Mirka Urešová.
  
- +Revize byly slavnostně ukončeny na sušenkovo-kávovo-čajovém posezení 3042009.  
-===== Překlad textů z PennTreebanku  ===== +Poslední zrevidované soubory byly odevzdány 352009.
-Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtinyPoslední přeložený soubor byl odevzdán 111. 2007+
- +
-  * Pokyny k překladu {{:external:pcedt:pokyny.txt|txt}} +
-  * Glosář {{:external:pcedt:glosar.xls|xls}} +
-  * Ukázka {{:external:pcedt:wsj1915.cz.txt|wsj1915.cz.txt}} {{:external:pcedt:wsj1915.en.txt|wsj1915.en.txt}} +
- +
-Textové verze anglických originálů: +
-  /f/project/bh/data/pcedt/en/*.en.txt +
-Textové verze českých překladů (po kontrolních skriptech): +
-  /f/project/bh/4057/section/*/*.cz.txt +
- +
- +
  
  
  
-==== Revize překladu ==== 
-Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu. 
-  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}} 
-  * Aktuální seznam nezrevidovaných souborů {{external:pcedt:soubory_k_revizi_070328.txt|soubory_k_revizi_070328.txt}} 
  
 +===== Revize revize aneb postrevize =====
  
-==== Korektura překladu ==== +Krátce po zahájení revizí se ukázalo, že i v zrevidovaných souborech je velká řada nedostatků (věcných, pravopisných), které nám při následném zpracování (anotaci) přidělávají spoustu práce, a že je velmi žádoucí tyto nedostatky odstraňovat ještě před tímnež se soubory začnou zpracovávat. Soubory upravené revizorkami se proto od samého začátku ještě jednou kontrolují (zprvu jen Marie Mikulová, pak i Jan Štěpánek)
-Do souborů se též zanášejí korekturykteré na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153+Od května 2009 pracují na postrevizích i dvě "nejlepší" revizorkyBlanka Cajthamlová a Jolana Janoušková.
-  * Seznam všech souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture.txt}}  +
-  * Aktuální seznam souborů určených ke korektuře+
  
  
  
 +===== Dokumenty =====
 +  * **Pokyny pro překladatele, revizory a korektory**: {{external:pcedt:translation_guidelines_090428.pdf|translation_guidelines_090428}}
 +  * **Glosář**: {{external:pcedt:glosar_090601.xls|glosar_090601}} 
  
-===== Rozšíření PDT-Vallexu ===== 
-Valenční slovník z PDT 2.0 byl doplněn o valenční rámce sloves, která jsou v datech PCEDT_cz a nebyla v datech PDT 2.0. 
  
 +----
  
 +Stav revizí a anotací je možné sledovat zde:
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  

[ Back to the navigation ] [ Back to the content ]