===== TODO ===== * 2 předložky za sebou * rc -- k michalově opravě přidělat dogenerované uzly, ať je to vidět už v autom. t-rovině ===== Změny v Afunech ===== ==== Sb ==== * Přidání JJ * nepomáhají žádná pravidla s pomlčkami, čárkami a podobně na eliminaci špatných parsů * pravidlo 'nedávat pod VBN, VBG' taky nefunguje (ale všechno je jen pár špatných parsů) * nezáleží ani na pomocném slovese, protože je dost konstrukcí bez něj -- "with the cheapest starting at ..." * adjektiva musí jít až po "it is reversed, said Peter" * vynechávat "next to" a "such as", věci pod slovesy s "to" ? * pozor: "the next to be promoted was ..." * Vyhodit "the" a "a/an" ==== interpunkce ==== * AuxG dostane cokoliv z interpunkce + závorky -LRB- + grave aksánty `` * pozor na '%', tváří se jako interpunkce ===== Infinitivy ===== * Značí se i pasivní a průběhové infinitivy * infinitivy bez "to" u vybraných pár sloves ===== Změny ve formémech ===== * Subjektová adjektiva dostanou substantivní formém n:subj. * Adjektiva s předložkami taky dostanou substantivní formém n:předl+X * vč. "složených adverbií", bohužel (zatím se nemění) * hodně adverbií, která jsou označena jako RHEM a dostávají tak 'x', dostane díky jinému pořadí bloků 'adv' * predeterminery (tag PDT "both", "all" apod.) se mění na adjektiva (adj:attr) * číslovky předcházející rozvíjené slovo se též mění na adjektiva (adj:attr) * pokus udělat v "$ 100" taky adjektiva nevyšel, MI se snížila * Předložky povoleny u * infinitivů * minulých časů (tam má vyšší prioritu než v:attr) * gerundií * "having to" se slepilo, tvar slovesa se řeší podle prvního auxu nebo lex. slovesa * do spojek pro slovesa přidány i předložky, zároveň vynecháno to, co je za prvním pom. slovesem * "???" přeznačeno na "fin" ===== Navrhované změny v t-lemmatech ===== ==== Složená adverbia ==== * ideálně by se mělo dělat podle seznamu (zatím ne) * such_as = v automatické je do aux.rf, ale ve zlatých je v apozici ? * as_as (?) ==== Složené spojky ==== * někde se anotuje, někde ne; from-to, both-and, between-and, whether-or * často se dělá ve zlatých datech jako 2 tektouzly nebo koordinace + aux.rf * záleží na významu -- proto radši vynechat !!! ===== Změny v parsech ===== ==== Složená zájmena ==== * how much, how many, how long -- taky se ve zlatých datech neanotuje, ale má jinou topologii (how visí na much -- na a-rovině je to naopak) * upraveno podle PEDT ===== Anglické funktory ===== * Upravené podle českých * Verze (fug2-en, fug2-en1) se liší zřejmě jen aktuálním parsingem + verzí anglických formémů ^ Pokus ^ Datum ^ Bez feat-sel ^ Feat-sel ^ | fug2-en2 | 2012-08-06 22:46 | 73.947 | 75.113 |