Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Last revision Both sides next revision | ||
padt:start [2013/06/25 09:38] zeman Otovo TODO. |
padt:start [2013/06/27 08:32] zeman |
||
---|---|---|---|
Line 119: | Line 119: | ||
Viz ''/ | Viz ''/ | ||
+ | |||
+ | ==== Chybějící syntaktické anotace ==== | ||
+ | |||
+ | 1771 uzlů (podle hamledtích testů) nemá afun. A většinou jsou to uzly v řetízcích zleva doprava, čili odkaz na rodiče také nevypadá důvěryhodně. Někdy jsou to celé věty, jindy jen úseky vět. Z jakého důvodu je anotátoři vynechali. Jsou ty úseky tak obtížné, že anotátoři nevěděli, co s nimi? | ||
+ | |||
+ | ==== Chybějící lemmata ==== | ||
+ | |||
+ | Uzly s čísly, interpunkcí a jinými symboly nemají lemmata. Buď můžeme zkopírovat slovní tvar do lemmatu, nebo pro čísla zavést jednotné lemma < | ||
+ | |||
+ | ==== Zmatky v koordinacích ==== | ||
+ | |||
+ | Stává se, že uzel je označen jako člen koordinace nebo apozice, ale jeho rodič nemá afun '' | ||
+ | |||
+ | ==== Předložky, | ||
+ | |||
+ | Za předložku považujeme slovo, které má morfologickou značku začínající písmenem P. Za normálních okolností by předložka měla dostat syntaktickou značku (analytickou funkci, afun) AuxP. Podle anotačního manuálu (http:// | ||
+ | |||
+ | Značka AuxY je ve [[http:// | ||
+ | |||
+ | Značka AuxM je specifická pro PADT, v českém PDT chybí. Smrž et al. ji stručně popisují jako „Particles modifying the verb“. Představoval bych si, že půjde o spíše o listy, ale u předložek označených tímto afunem to rozhodně neplatí. Anotační manuál PADT jim věnuje kapitolu 3. I v manuálu lze nalézt příklady, kde AuxM není list. | ||
+ | |||
+ | Částice سِوَى siwā (other than, except for, až na, kromě) je podle manuálu jedna ze dvou částic, které negují předcházející výraz a zavádějí místo něj následující výraz. V korpusu má morfologickou značku ''< |