[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Anotace RHEM, PREC a CM

Kristýna Č., Katka Veselá, Lucie

ze schůzky 14.8.08:

- čárky v angličtině za daným výrazem na začátku věty
- předchozího konkrétního časového údaje
- překladu do ČJ

if … then (then = PREC)
přesto + koordinace = PREC
lists = PREC
as a result = vždy PREC
also před slovesem - na rozhodnutí anotátora, koukat na sémantiku předchozí věty

accordingly, consequently - prozkoumá Kristýna

so far - (LM, 23.9.) po mém hledání v Quirkovi a po slovnících je opravdu asi časové - tj. so EXT závislé na far TWHEN. Možná by se dalo uvažovat o PRECu, kdyby to v nějakém kontextu vypadalo jako “do tohoto místa v textu” či “z toho, co jsem zatím řekl”. Musíme je sledovat.

Nejasné či problematické struktury a evidentní chyby nadělané automatickými opravami v již anotovaných souborech pište sem i s číslem věty.

LM, 5.8.09: Pozor, automatická procedura na neanotovaných datech mnoho vylepšila, ale když se pustí na datech anotovaných (z nichž většina stejně prošla pod rukama jedné z nás třech), udělá víc škody než užitku, tj. změní už jednou správnou anotaci na špatnou a my to znovu opravujeme. Příklad: too many - anotováno jako too.EXT a syn; automaticky “opraveno” na too.RHEM a syn (což ani nejde!), ručně se musí opravit zpět :-(
Otázka - vadí nám to? Je už to na maličko datech, tak už to doopravíme, ale jednak pro přístě a jednak - nedá se na tom třeba měřit spolehlivě shoda!


Schůzka 12. 9. 08

1. PREC
Jednoslovné výrazy, které jsou na začátku věty, jsou zpravidla správně označeny jako PREC. Zatím se v takové pozici vyskytly and, furthermore, but, meanwhile, ultimately, still, however, thus, otherwise, yet, instead, separately, overall, then, rather.

PREC s podtržítky
Jako víceslovné výrazy s podtržítkovými lemmaty se objevily některé výrazy z manuálu (at_least, as_well), ale i některé, které v něm nejsou (by_contrast, on_the_other_hand), je tedy třeba vyřešit, jak anotovat jednotlivé víceslovné výrazy a mj. to, jestli může PREC uzel mít potomky.
Návrh na řešení od Marušky:
Pokud je PREC uzel víceslovný s potenciálním závislým t-uzlem, tak ho
tak rozebrat - (tedy “on the other hand”, člen a předlozku schovat u
hand.PREC, other RSTR). Pokud je to PREC víceslovný bez nároku na závislý
uzel (by contrast, in contrast, in addition atd.), lema napsat s
podtržítkem a předložku navíc schovat do aux. A pokud se nebudete moci
rozhodnout mezi PREC a TWHEN, dejte raději TWHEN - jsou tak většinou v
češtině, (meanwhile, in the meantime, so far, simultaneously…), přičemž
u TWHENů nejsou podtržítka a možné předložky jdou jen do aux, ne do
lematu. Pozor: pokud TWHEN neodpovídá logickému průběhu času - (jako že se
řekne “zároveň” a ono je to vlastně “potom”), tak je to PREC.

2. RHEM
Rematizátory, které procedura ozančuje jako rematizátory, ale nejsou nikdy, nebo skoro nikdy rematizátory: further, again, alone

LM, 5.8. 09: Kristýnin návrh na anotaci alone:
“he did sth alone.COMPL”
“he alone.RHEM did sth”

Specifické rematizátory před vedlejšími větami:
Jde o některé výrazy, nejčastěji s měrovým významem, které fungují jako rematizátory především před podřadicí spojkou:
partly, particularly, largely, mostly, exclusively

Příklad: Indeed , that happened to some extent yesterday , as industrial stocks rebounded , partly on news of takeovers in the paper industry .
Toto se včera skutečně v určitém rozsahu stalo, když se průmyslové akcie vzchopily, částečně díky zprávám o koupích v papírovém průmyslu.
STROM

Pokud jsou tyto výrazy rozvitími jmen, nebo rozvíjí přímo sloveso, fungují zpravidla jako EXT, v případech s vedlejšími větami mají zřejmě významy oba, podiskusi jsme se shodly, že jim v těchto pozicích budeme dávat fuktor RHEM.

Rematizátory na konci věty:
Výrazy, které se vyskytují za čárkou na konci věty, mohou být PREC nebo RHEM, podle toho, jaký mají zpětný dosah (jestli na celou větu nebo na její část). V této pozici se vyskytly either a too.

Typické rematizátory s volnou pozicí:
also, only, just
Just se vyskytuje jako rematizátor velice často, daleko častěji než v časovém významu.
Also funguje obousměrně, je třeba rozhodovat podle toho, jak vypadají předchozí věty, zda má dosah dopředu nebo dozadu ve větě. Jeho dosah je velice variabilní a s mnoha možnostmi interpretace, zvlášť v souvislosti s češtinou. Bude třeba ho dále sledovat.

Příklad:
Britain 's unsettled political scene also worries some investors .
STROM KONTEXT

Homonymie
Některé výrazy jsou homonymní s jinými významy kvůli zanedbání následující předložky: as_well a as well as, in_addition a in addition to.
Rozhodně nejde o rematizátory v případech rozvíjení jména (např too a further tady fungují jako měrová určení).

Technická řešení:
Pokud rematizátor závisí na modálním slovese, pod kterým je koordinace, je problém, kam ho pověsit. Na radu Marušky navrhuji, aby se v takových případech věšel rematizátor na spojku vlevo před první koordinovaný člen.

Příklad:
In a statement , the company said : `` Both parts can only realize their full potential and be appropriately valued *-1 by the market if they are separately quoted companies .
V jednom prohlášení společnost uvedla: “Obě části mohou pouze realizovat svůj plný potenciál a mít na trhu příslušnou hodnotu, pokud to jsou společnosti zalistované odděleně.
STROM

Při elipse se rematizátor zavěšuje na elidovanou část před uzel, který má v dosahu.

Příklad:
The DAX index closed at 1466.29 , up only 3.36 .
STROM

RHEM x EXT !! (LM, 23.9.)
Pokud se potenciální RHEM vztahuje k číselnému údaji či kvantifikátoru, je to EXT!!
Např.: only a few pennies, at least ten people, (také EXT too late, too often)
??? Pozor, be largely EXT supported x be supported largely RHEM by X - různá interpretace!! - Ale nevím, zda oboje nemůže být oboje a zda ten slovosled vše rozhoduje…

dodatek k EXT (LM, 10.10.)
Pokud je pred cislem (kvantifikatorem) predlozka, ktera se da prelozit zas
jen a pouze jako predlozka, (under, above, below,), bude schovana u ridiciho substantiva a to, co
je predtim za svitici uzel (only, just, nevim co vsechno), bude viset jako
EXT na cislu.

Pokud je pred cislem (kvantifikatorem) neco, co jde prelozit taky jinak
nez predlozkou (about, approximately…) (= kolem, okolo, asi, priblizne),
tak to ma vlastni t-uzel s EXT (visi to na cislu), a na nem visi dalsi EXT
(onlyEXT aboutEXT twoRSTR people), (at_least EXT somewhat EXT interesting
RSTR).


[ Back to the navigation ] [ Back to the content ]