[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
external:pcedt:done [2007/05/17 10:17]
mikulova
external:pcedt:done [2009/12/04 14:16]
mikulova
Line 1: Line 1:
-====== Příprava anotace PCEDT_cz ======+====== Revize a postrevize překladů ====== 
 +Další a podrobnější infromace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]].
  
  
- 
- 
- 
- 
- 
- 
- 
- 
- 
-===== Překlad textů z PennTreebanku  ===== 
 Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007. Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
- 
-Textové verze anglických originálů: 
-  /f/project/bh/data/pcedt/en/*.en.txt 
-Textové verze českých překladů (po kontrolních skriptech): 
-  /f/project/bh/4057/section/*/*.cz.txt 
- 
-**__Pokyny pro překladatele, revizory a korektory__**: {{external:pcedt:translation_guidelines3.doc|translation_guidelines3.doc}} 
- 
- 
- 
- 
  
  
  
  
-==== Revize překladu ==== +===== Revize překladu ===== 
-Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu+Do přeložených souborů se zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153.  
-  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}} +  * Seznam všech souborů určených ke "papírové" korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture}}  
-  * Aktuální seznam nezrevidovaných souborů {{external:pcedt:soubory_k_revizi_070418.txt|soubory_k_revizi_070418.txt}}+Na "papírových" korekturách pracovala Jana Grollová.
  
-Na revizi překladu pracuje:   +Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642.  
-  * Stanislava Švecová +  * Seznam problematických souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_reviziI}} 
-  Eva Dubová+Tyto revize prováděli: Eva Dubová, Jan Hajič jr., Stáňa Švecová, Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková.
  
 +V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že revize překladu bude provedena **na všech souborech PCEDT_cz** (které doposud nebyly oanotovány).
 +K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí.
 +  * Seznam souborů k revizi ve druhé fázi (jméno souboru - počet vět - počet českých slov) {{:external:pcedt:revize_druhafaze.txt|soubory_k_reviziII}}
 +Tyto revize prováděly: Jolana Janoušková, Zuzana Krulichová, Romana Workmann-Víšková, Blanka Cajthamlová, Mirka Urešová.
  
 +Revize byly slavnostně ukončeny na sušenkovo-kávovo-čajovém posezení 30. 4. 2009. 
 +Poslední zrevidované soubory byly odevzdány 3. 5. 2009.
  
  
  
  
-==== Korektura překladu ==== +===== Revize revize aneb postrevize =====
-Do souborů se též zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. +
-  * Seznam všech souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture.txt}}  +
-  * Aktuální seznam souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture_070516.txt|ke_korekture_070516.doc}}+
  
-Na korektuře překladu pracuje:    +Krátce po zahájení revizí se ukázalo, že i v zrevidovaných souborech je velká řada nedostatků (věcných, pravopisných), které nám při následném zpracování (anotaci) přidělávají spoustu práce, a žje velmi žádoucí tyto nedostatky odstraňovat ještě ed tím, než se soubory začnou zpracovávat. Soubory upravené revizorkami se proto od samého začátku ještě jednou kontrolují (zprvu jen Marie Mikulová, pak i Jan Štěpánek). 
-  * Jana Grollová+Od května 2009 pracují na postrevizích i dvě "nejlepší" revizorky: Blanka Cajthamlová a Jolana Janoušková.
  
  
  
 +===== Dokumenty =====
 +  * **Pokyny pro překladatele, revizory a korektory**: {{external:pcedt:translation_guidelines_090428.pdf|translation_guidelines_090428}}
 +  * **Glosář**: {{external:pcedt:glosar_090601.xls|glosar_090601}} 
  
-===== Rozšíření PDT-Vallexu ===== 
-Valenční slovník z PDT 2.0 byl doplněn o valenční rámce sloves, která jsou v datech PCEDT_cz a nebyla v datech PDT 2.0. 
  
 +----
  
 +Stav revizí a anotací je možné sledovat zde:
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  

[ Back to the navigation ] [ Back to the content ]