[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Překlad textů z PennTreebanku

Všech 2312 souborů (cca 49 000 vět) bylo několika různými překladateli přeloženo do češtiny. Poslední přeložený soubor byl odevzdán 11. 1. 2007.

Textové verze anglických originálů:

/f/project/bh/data/pcedt/en/*.en.txt

Textové verze českých překladů (po kontrolních skriptech):

/f/project/bh/4057/section/*/*.cz.txt

Korektura překladu

Do přeložených souborů se zanášejí korektury, které na vytištěných papírových verzích prováděl prof. Kirschner. Takových souborů je 153.

Revize překladu

Ze všech přeložených souborů byly vybrány soubory, které obsahují z hlediska překladu problematická místa (označená překladateli speciálními znaky %%, $$, &&, §§, ??). Takových souborů bylo zjištěno 642. V současné době probíhá na těchto souborech revize překladu.

V létě 2007 bylo rozhodnuto (vzhledem k nedostatečné kvalitě překladů vůbec), že korektura (revize) bude provedena na všech souborech PCEDT_cz (ktere doposud nebyly oanotovány).
K anotaci jsou proto přednostně udělovány soubory, které již prošly revizí.

Stav revizí a anotací je možné sledovat zde:
Automaticky generovaný přehled anotovaných souborů

Dokumenty


Další informace jsou k dispozici na interních stránkách projektu - Interní poznámky.


[ Back to the navigation ] [ Back to the content ]