This is an old revision of the document!
Přehled pdt-korpusů s manuální tektogramatickou anotací
PDT 2.0 | PDT 2.5/3.0 | PCEDT-cz | PDTSC | FAUST | |
---|---|---|---|---|---|
počet tokenů | 833 195 | 833 195 | 1 151 150 | 742 257 | 33 772 |
počet vět | 49 431 | 49 431 | 49 208 | 73 835 | 3 000 |
morfologická | manuálně | manuálně | automaticky | automaticky | automaticky |
analytická | manuálně | manuálně | automaticky | automaticky | automaticky |
a.rf | automaticky | automaticky | manuálně | manuálně | manuálně |
gramatémy | poloauto | poloauto | ne (auto) | ne (auto) | ne (auto) |
struktura | manuálně | manuálně | manuálně | manuálně | manuálně |
funktory | manuálně | manuálně | manuálně | manuálně | manuálně |
subfunktory | automaticky | automaticky | ne | ne | ne (auto) |
valence | manuálně | manuálně | manuálně | manuálně | manuálně |
– u substantiv | manuálně | manuálně | ne (RSTR) | ne (RSTR) | ne (RSTR) |
coref-gram | manuálně | manuálně | manuálně | bude | ne |
coref-text | manuálně | manuálně | manuálně | bude | ne |
deepord, tfa | manuálně | manuálně | bude | ne | ne |
quot | manuálně | manuálně | ne | ne | ne |
klauze (na anal.) | ne | automaticky | ne | ne | ne |
víceslovné výrazy | ne | manuálně | ne | ne | ne |
typgroup | ne | manuálně | ne | manuálně | ne |
formémy | ne | bude | automaticky | ne | ne |
sentmod | automaticky | manuálně | ne | ne | ne |
factmod | ne | manuálně | ne | ne | ne |
coref – 1a2. osoba | ne | bude | bude | bude | ne |
coref-text-rozšíř. | ne | manuálně | ne | ne | ne |
diskurz | ne | manuálně | ne | ne | ne |
bridging | ne | manuálně | ne | ne | ne |