Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
pdtsc:start [2007/05/31 15:29] ptacek Links to external:pdtsc:todo changed to pdtsc:todo |
pdtsc:start [2009/02/02 10:04] mikulova |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Prague Dependency Treebank of Spoken Czech (PDTSC) ====== | ====== Prague Dependency Treebank of Spoken Czech (PDTSC) ====== | ||
- | **Pražský závislostní korpus mluvené češtiny** (Prague Dependency Treebank of Spoken Czech; PDTSC)) bude hloubkově syntakticky anotovaný korpus mluvené češtiny pro účely pravděpodobnostního trénování a strojového učení za účelem plného porozumění mluvené řeči. | + | **Pražský závislostní korpus mluvené češtiny** (Prague Dependency Treebank of Spoken Czech; PDTSC) bude hloubkově syntakticky anotovaný korpus mluvené češtiny pro účely pravděpodobnostního trénování a strojového učení za účelem plného porozumění mluvené řeči. |
- | Předpokládáme, že data korpusu PDTSC budou data z existujících mluvených korpusů, ke kterým se podaří získat | + | Původním záměrem při budování PDTSC bylo syntakticko-sémanticky anotovat mluvenou řeč podle pravidel pro anotaci psaných textů Pražského závislostního korpusu a tato pravidla pouze upravovat a rozšiřovat pro zvláštnosti mluvené řeči. Lingvistická analýza mluvené řeči a první pokusy se syntaktickou anotací však ukázaly, že vzhledem ke specifičnosti mluveného projevu je tento původní záměr |
- | Jako první data pro anotaci byla zvolena **data z projektu Malach**, která leží zhruba | + | Jako první data pro anotaci byla zvolena **data z projektu Malach**. |
+ | Vedle malachovských dat anotujeme také české dialogy **Senior Companions** (v rámci projektu Companions). | ||
* [[people|Kdo na tom dělá a pod které projekty to patří]] | * [[people|Kdo na tom dělá a pod které projekty to patří]] | ||
- | | + | * [[todo|Rekonstrukce standardizovaného textu z mluvené řeči]] |
- | | + | * [[:pdtsc:internal:start|Interní poznámky]] |
- | * [[: | + | |