[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
external:pcedt:done [2007/04/10 16:28]
mikulova
external:pcedt:done [2008/01/14 09:36]
mikulova
Line 1: Line 1:
-====== Příprava anotace PCEDT_cz ======+====== Překlad textů z PennTreebanku ======
  
- 
- 
- 
- 
- 
- 
- 
- 
- 
-===== Překlad textů z PennTreebanku  ===== 
 Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007. Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
- 
-  * Pokyny k překladu {{:external:pcedt:pokyny.txt|txt}} 
-  * Glosář {{:external:pcedt:glosar.xls|xls}} 
-  * Ukázka {{:external:pcedt:wsj1915.cz.txt|wsj1915.cz.txt}} {{:external:pcedt:wsj1915.en.txt|wsj1915.en.txt}} 
  
 Textové verze anglických originálů: Textové verze anglických originálů:
Line 22: Line 8:
   /f/project/bh/4057/section/*/*.cz.txt   /f/project/bh/4057/section/*/*.cz.txt
  
 +**__Pokyny pro překladatele, revizory a korektory__**: {{external:pcedt:translation_guidelines_071119.pdf|translation_guidelines_071119.pdf}}
 +**__Glosář__**: {{external:pcedt:glosar_080114.xls|glosar_080114.xls}}
  
  
 +===== Revize překladu =====
 +Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu.
 +  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}}
 + 
  
  
Line 29: Line 21:
  
  
-==== Revize překladu ==== 
-Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu. 
-  * Seznam všech souborů určených k revizi {{:external:pcedt:soubory_k_revizi.txt|soubory_k_revizi.txt}} 
-  * Aktuální seznam nezrevidovaných souborů {{external:pcedt:soubory_k_revizi_070410.txt|soubory_k_revizi_070410.txt}} 
  
  
-==== Korektura překladu ====+ 
 + 
 +===== Korektura překladu ====
 Do souborů se též zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153. Do souborů se též zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153.
   * Seznam všech souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture.txt}}    * Seznam všech souborů určených ke korektuře {{external:pcedt:soubory_ke_korekture.txt|soubory_ke_korekture.txt}} 
-  * Aktuální seznam souborů určených ke korektuře 
- 
- 
  
 +----
  
-===== Rozšíření PDT-Vallexu ===== +V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec)že korektura (revize) bude provedena **na všech souborech PCEDT_cz** (ktere doposud nebyly oanotovány) 
-Valenční slovník z PDT 2.0 byl doplněn o valenční rámce sloveskterá jsou datech PCEDT_cz a nebyla v datech PDT 2.0.+K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí
  
 +Stav revizí a anotací je možné sledovat zde:
 +[[https://blackbird.ms.mff.cuni.cz/stepanek/wsj-cz-anot|Automaticky generovaný přehled anotovaných souborů]]
  
  

[ Back to the navigation ] [ Back to the content ]