===== Anotace RHEM, PREC a CM ===== Kristýna Č., Katka Veselá, Lucie * v zásadě se řídit Silviiným dodatkem {{external:parataxis.pdf|parataxis}} * v něm seznam anglických PREC - revize Lucie * navíc seznam anglických RHEM - revize Katka === ze schůzky 14.8.08: === * u případů homonymie časových funktorů a PREC se rozhodovat dle: - čárky v angličtině za daným výrazem na začátku věty - předchozího konkrétního časového údaje - překladu do ČJ if ... then (then = PREC) přesto + koordinace = PREC lists = PREC as a result = vždy PREC also před slovesem - na rozhodnutí anotátora, koukat na sémantiku předchozí věty accordingly, consequently - prozkoumá Kristýna **so far** - (LM, 23.9.) po mém hledání v Quirkovi a po slovnících je opravdu asi časové - tj. so **EXT** závislé na far **TWHEN**. Možná by se dalo uvažovat o PRECu, kdyby to v nějakém kontextu vypadalo jako "do tohoto místa v textu" či "z toho, co jsem zatím řekl". Musíme je sledovat. **Nejasné či problematické struktury a evidentní chyby** nadělané automatickými opravami v již anotovaných souborech pište **sem** i s číslem věty. LM, 5.8.09: Pozor, automatická procedura na neanotovaných datech mnoho vylepšila, ale když se pustí na datech anotovaných (z nichž většina stejně prošla pod rukama jedné z nás třech), udělá víc škody než užitku, tj. změní už jednou správnou anotaci na špatnou a my to znovu opravujeme. Příklad: too many - anotováno jako too.EXT a syn; automaticky "opraveno" na too.RHEM a syn (což ani nejde!), ručně se musí opravit zpět :-( Otázka - vadí nám to? Je už to na maličko datech, tak už to doopravíme, ale jednak pro přístě a jednak - nedá se na tom třeba měřit spolehlivě shoda! ---- **Schůzka 12. 9. 08** 1. PREC Jednoslovné výrazy, které jsou na začátku věty, jsou zpravidla správně označeny jako PREC. Zatím se v takové pozici vyskytly //and, furthermore, but, meanwhile, ultimately, still, however, thus, otherwise, yet, instead, separately, overall, then, rather.// PREC s podtržítky Jako víceslovné výrazy s podtržítkovými lemmaty se objevily některé výrazy z manuálu (//at_least, as_well//), ale i některé, které v něm nejsou (//by_contrast, on_the_other_hand//), je tedy třeba vyřešit, jak anotovat jednotlivé víceslovné výrazy a mj. to, jestli může PREC uzel mít potomky. Návrh na řešení od Marušky: Pokud je PREC uzel víceslovný s potenciálním závislým t-uzlem, tak ho tak rozebrat - (tedy "on the other hand", člen a předlozku schovat u hand.PREC, other RSTR). Pokud je to PREC víceslovný bez nároku na závislý uzel (by contrast, in contrast, in addition atd.), lema napsat s podtržítkem a předložku navíc schovat do aux. A pokud se nebudete moci rozhodnout mezi PREC a TWHEN, dejte raději TWHEN - jsou tak většinou v češtině, (meanwhile, in the meantime, so far, simultaneously...), přičemž u TWHENů nejsou podtržítka a možné předložky jdou jen do aux, ne do lematu. Pozor: pokud TWHEN neodpovídá logickému průběhu času - (jako že se řekne "zároveň" a ono je to vlastně "potom"), tak je to PREC. 2. RHEM Rematizátory, které procedura ozančuje jako rematizátory, ale nejsou nikdy, nebo skoro nikdy rematizátory: //further, again, alone// LM, 5.8. 09: Kristýnin návrh na anotaci //alone//: "he did sth alone.COMPL" "he alone.RHEM did sth" Specifické rematizátory před vedlejšími větami: Jde o některé výrazy, nejčastěji s měrovým významem, které fungují jako rematizátory především před podřadicí spojkou: //partly, particularly, largely, mostly, exclusively// Příklad: Indeed , that happened to some extent yesterday , as industrial stocks rebounded , partly on news of takeovers in the paper industry . Toto se včera skutečně v určitém rozsahu stalo, když se průmyslové akcie vzchopily, částečně díky zprávám o koupích v papírovém průmyslu. [[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359&sentenceid=EnglishT-wsj_0359-s11&sentenceord=11&sentencemax=57|STROM]] Pokud jsou tyto výrazy rozvitími jmen, nebo rozvíjí přímo sloveso, fungují zpravidla jako EXT, v případech s vedlejšími větami mají zřejmě významy oba, podiskusi jsme se shodly, že jim v těchto pozicích budeme dávat fuktor RHEM. Rematizátory na konci věty: Výrazy, které se vyskytují za čárkou na konci věty, mohou být PREC nebo RHEM, podle toho, jaký mají zpětný dosah (jestli na celou větu nebo na její část). V této pozici se vyskytly //either// a //too//. Typické rematizátory s volnou pozicí: //also, only, just// Just se vyskytuje jako rematizátor velice často, daleko častěji než v časovém významu. Also funguje obousměrně, je třeba rozhodovat podle toho, jak vypadají předchozí věty, zda má dosah dopředu nebo dozadu ve větě. Jeho dosah je velice variabilní a s mnoha možnostmi interpretace, zvlášť v souvislosti s češtinou. Bude třeba ho dále sledovat. Příklad: Britain 's unsettled political scene also worries some investors . [[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359&sentenceid=EnglishT-wsj_0359-s19&sentenceord=19&sentencemax=57|STROM]] [[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359|KONTEXT]] Homonymie Některé výrazy jsou homonymní s jinými významy kvůli zanedbání následující předložky: //as_well// a //as well as//, //in_addition// a //in addition to//. Rozhodně nejde o rematizátory v případech rozvíjení jména (např //too// a //further// tady fungují jako měrová určení). Technická řešení: Pokud rematizátor závisí na modálním slovese, pod kterým je koordinace, je problém, kam ho pověsit. Na radu Marušky navrhuji, aby se v takových případech věšel rematizátor na spojku vlevo před první koordinovaný člen. Příklad: In a statement , the company said : `` Both parts can only realize their full potential and be appropriately valued *-1 by the market if they are separately quoted companies . V jednom prohlášení společnost uvedla: "Obě části mohou pouze realizovat svůj plný potenciál a mít na trhu příslušnou hodnotu, pokud to jsou společnosti zalistované odděleně. [[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=037&file=0376&sentenceid=EnglishT-wsj_0376-s14&sentenceord=14&sentencemax=16|STROM]] Při elipse se rematizátor zavěšuje na elidovanou část před uzel, který má v dosahu. Příklad: The DAX index closed at 1466.29 , up only 3.36 . [[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=037&file=0374&sentenceid=EnglishT-wsj_0374-s44&sentenceord=44&sentencemax=53|STROM]] **RHEM x EXT !!** (LM, 23.9.) Pokud se potenciální RHEM vztahuje k číselnému údaji či kvantifikátoru, je to EXT!! Např.: only a few pennies, at least ten people, (také EXT too late, too often) **???** Pozor, be largely EXT supported x be supported largely RHEM by X - různá interpretace!! - Ale nevím, zda oboje nemůže být oboje a zda ten slovosled vše rozhoduje... **dodatek k EXT** (LM, 10.10.) Pokud je pred cislem (kvantifikatorem) predlozka, ktera se da prelozit zas jen a pouze jako predlozka, (under, above, below,), bude schovana u ridiciho substantiva a to, co je predtim za svitici uzel (only, just, nevim co vsechno), bude viset jako EXT na cislu. Pokud je pred cislem (kvantifikatorem) neco, co jde prelozit taky jinak nez predlozkou (about, approximately...) (= kolem, okolo, asi, priblizne), tak to ma vlastni t-uzel s EXT (visi to na cislu), a na nem visi dalsi EXT (onlyEXT aboutEXT twoRSTR people), (at_least EXT somewhat EXT interesting RSTR).