Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Last revision Both sides next revision | ||
komputacni-lingvistika:komputacni-lingvistika:kurpusy-tab [2012/12/06 11:26] mikulova |
komputacni-lingvistika:komputacni-lingvistika:kurpusy-tab [2012/12/06 11:31] mikulova |
||
---|---|---|---|
Line 44: | Line 44: | ||
(časopis Vesmír není zastoupen na tektogramatické rovině) | (časopis Vesmír není zastoupen na tektogramatické rovině) | ||
+ | **PDT 2.5** (2011, ÚFAL) | ||
+ | **Prague Dependency Treebank 2.5** | ||
+ | http:// | ||
+ | Identické texty jako PDT 2.0, obohacená tektogramatická a analytická anotace. | ||
+ | |||
+ | **PDT 3.0** (plán 2013, LDC) | ||
+ | **Prague Dependency Treebank 3.0** | ||
+ | Identické texty jako PDT 2.0. | ||
+ | Korpus bude zahrnovat PDT 2.5 plus další novinky v anotaci na tektogramatické rovině. | ||
+ | |||
+ | **PCEDT 2.0** (2011, LDC) | ||
+ | **Prague Czech-English Dependency Treebank 2.0** | ||
+ | http:// | ||
+ | Články z anglického deníku //Wall Street Journal// (z let 1989), které byly pro českou část korpusu přeloženy (profesionálními překladateli) do češtiny. | ||
+ | |||
+ | **PDTSC 2.0** (plán 2013, LDC) | ||
+ | **Prague Dependency Treebank of Spoken Czech 2.0** | ||
+ | (verze 1.0 (http:// | ||
+ | České texty z projektu | ||
+ | Doslovný přepis mluvené řeči (w-rovina) je na m-rovině nahrazen tzv. standardizovaným textem (rekonstrukce mluvené řeči). | ||
+ | |||
+ | **FAUST** (2011) | ||
+ | Korpus vznikl pro projekt FAUST: | ||
+ | Obsahuje 3 x 1 000 krátkých segmentů textu, které si různí uživatelé nechali přeložit na on-line serveru www.reverso.net. Původní anglické znění prošlo korekturou a následně bylo přeloženo do češtiny nezávisle třemi překladateli. Poznámka: řada segmentů má velmi vulgární obsah. | ||