[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
external:pcedt:done [2007/02/13 11:52]
mikulova
external:pcedt:done [2009/05/11 16:03]
mikulova
Line 1: Line 1:
-====== Příprava anotace PCEDT_cz ======+====== Revize a korektury překladů ====== 
 +Další a podrobnější infromace jsou k dispozici na [[:pcedt:internal:start|interních stránkách projektu]].
  
  
 +Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
  
  
  
 +===== "Papírová" korektura překladu =====
  
 +Do přeložených souborů se zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153.
 +  * Seznam všech souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture}} 
  
  
- 
- 
-===== Překlad textů z PennTreebanku  ===== 
-Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007. 
- 
-  * Pokyny k překladu {{:external:pcedt:pokyny.txt|txt}} 
-  * Glosář {{:external:pcedt:glosar.xls|xls}} 
-  * Ukázka {{:external:pcedt:wsj1915.cz.txt|wsj1915.cz.txt}} {{:external:pcedt:wsj1915.en.txt|wsj1915.en.txt}} 
- 
-Textové verze anglických originálů: 
-  /f/project/bh/data/pcedt/en/*.en.txt 
-Textové verze českých překladů (po kontrolních skriptech): 
-  /f/project/bh/4057/section/*/*.cz.txt 
  
  
  
 +===== Revize překladu =====
 +Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. 
 +  * Seznam problematických souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_reviziI}}
  
 +V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že revize překladu bude provedena **na všech souborech PCEDT_cz** (ktere doposud nebyly oanotovány).
 +K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí.
 +  * Seznam souborů k revizi ve druhé fázi (jméno souboru - počet vět - počet českých slov) {{:external:pcedt:revize_druhafaze.txt|soubory_k_reviziII}}
  
-==== Revize překladu ==== +Revize byly slavnostně ukončeny na sušenkovo-kávovo-čajovém posezení 304. 2009. Poslední zrevidované soubory byly odevzdány 352009.
-Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu. +
-  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}} +
-  * Aktuální seznam nezrevidovaných souborů {{:external:pcedt:soubory_k_revizi_070210.txt|soubory_k_revizi_070210.txt}}+
  
  
 +Stav revizí a anotací je možné sledovat zde:
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  
  
  
  
-===== Rozšíření PDT-Vallexu ===== +===== Dokumenty ===== 
-Valenční slovník z PDT 2.0 byl doplněn o valenční rámce sloveskterá jsou v datech PCEDT_cz nebyla v datech PDT 2.0.+  * **Pokyny pro překladatelerevizory korektory**: {{external:pcedt:translation_guidelines_090428.pdf|translation_guidelines_090428}} 
 +  * **Glosář**: {{external:pcedt:glosar_090428.xls|glosar_090428}} 
  
  
  

[ Back to the navigation ] [ Back to the content ]