This is an old revision of the document!
Table of Contents
Překlad textů z PennTreebanku
Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.
Textové verze anglických originálů:
/f/project/bh/data/pcedt/en/*.en.txt
Textové verze českých překladů (po kontrolních skriptech):
/f/project/bh/4057/section/*/*.cz.txt
Pokyny pro překladatele, revizory a korektory: translation_guidelines_071119.pdf
Glosář: glosar_080114.xls
Revize překladu
Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu.
- Seznam všech souborů určených k revizi soubory_k_revizi.txt
Korektura překladu
Do souborů se též zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153.
- Seznam všech souborů určených ke korektuře soubory_ke_korekture.txt
V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že korektura (revize) bude provedena na všech souborech PCEDT_cz (ktere doposud nebyly oanotovány).
K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí.