This is an old revision of the document!
Table of Contents
TODO
- 2 předložky za sebou
Změny v Afunech
Sb
- Přidání JJ
- nepomáhají žádná pravidla s pomlčkami, čárkami a podobně na eliminaci špatných parsů
- pravidlo 'nedávat pod VBN, VBG' taky nefunguje (ale všechno je jen pár špatných parsů)
- nezáleží ani na pomocném slovese, protože je dost konstrukcí bez něj – “with the cheapest starting at …”
- adjektiva musí jít až po “it is reversed, said Peter”
- vynechávat “next to” a “such as”, věci pod slovesy s “to” ?
- pozor: “the next to be promoted was …”
- Vyhodit “the” a “a/an”
interpunkce
- AuxG dostane cokoliv z interpunkce + závorky -LRB- + grave aksánty ``
- pozor na '%', tváří se jako interpunkce
Infinitivy
- Značí se i pasivní a průběhové infinitivy
- infinitivy bez “to” u vybraných pár sloves
Změny ve formémech
- Subjektová adjektiva dostanou substantivní formém n:subj.
- Adjektiva s předložkami taky dostanou substantivní formém n:předl+X
- vč. “složených adverbií”, bohužel (zatím se nemění)
- hodně adverbií, která jsou označena jako RHEM a dostávají tak 'x', dostane díky jinému pořadí bloků 'adv'
- predeterminery (tag PDT “both”, “all” apod.) se mění na adjektiva (adj:attr)
- číslovky předcházející rozvíjené slovo se též mění na adjektiva (adj:attr)
- pokus udělat v “$ 100” taky adjektiva nevyšel, MI se snížila
- Předložky povoleny u
- infinitivů
- minulých časů (tam má vyšší prioritu než v:attr)
- gerundií
- “having to” se slepilo, tvar slovesa se řeší podle prvního auxu nebo lex. slovesa
- do spojek pro slovesa přidány i předložky, zároveň vynecháno to, co je za prvním pom. slovesem
Změny v lemmatech
Složená adverbia
- ideálně by se mělo dělat podle seznamu (zatím ne)
- such_as = v automatické je do aux.rf, ale ve zlatých je v apozici ?
- as_as (?)
Složené spojky
- někde se anotuje, někde ne; from-to, both-and, between-and, whether-or
- často se dělá ve zlatých datech jako 2 tektouzly nebo koordinace + aux.rf
- záleží na významu – proto radši vynechat !!!
Složená zájmena
- how much, how many, how long – taky se ve zlatých datech neanotuje, ale má jinou topologii (how visí na much – na a-rovině je to naopak)
- upraveno podle PEDT