[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
external:anotace-rematizatoru-a-konektoru [2008/08/25 10:43]
anotator vytvořeno
external:anotace-rematizatoru-a-konektoru [2009/08/05 12:18] (current)
anotator
Line 1: Line 1:
 ===== Anotace RHEM, PREC a CM ===== ===== Anotace RHEM, PREC a CM =====
 +Kristýna Č., Katka Veselá, Lucie
  
-- Kristýna Č., Katka Veselá, Lucie+  *  v zásadě se řídit Silviiným dodatkem {{external:parataxis.pdf|parataxis}} 
 +  *  v něm seznam anglických PREC - revize Lucie 
 +  *  navíc seznam anglických RHEM - revize Katka
  
-- v zásadě se řídit Silviiným dodatkem parataxis 
-- v něm seznam anglických PREC - revize Lucie 
-- seznam anglických RHEM - revize a dodaní Katka 
  
-== ze schůzky 14.8.08: ==+=== ze schůzky 14.8.08: ==
 + 
 +  * u případů homonymie časových funktorů a PREC se rozhodovat dle: 
 +- čárky v angličtině za daným výrazem na začátku věty 
 +- předchozího konkrétního časového údaje 
 +- překladu do ČJ 
 + 
 +if ... then (then = PREC) 
 +přesto + koordinace = PREC 
 +lists = PREC 
 +as a result = vždy PREC 
 +also před slovesem - na rozhodnutí anotátora, koukat na sémantiku předchozí věty 
 + 
 +accordingly, consequently - prozkoumá Kristýna 
 + 
 +**so far** - (LM, 23.9.) po mém hledání v Quirkovi a po slovnících je opravdu asi časové - tj. so **EXT** závislé na far **TWHEN**. Možná by se dalo uvažovat o PRECu, kdyby to v nějakém kontextu vypadalo jako "do tohoto místa v textu" či "z toho, co jsem zatím řekl". Musíme je sledovat. 
 + 
 + 
 + 
 +**Nejasné či problematické struktury a evidentní chyby** nadělané automatickými opravami v již anotovaných souborech pište **sem**  i s číslem věty. 
 + 
 +LM, 5.8.09: Pozor, automatická procedura na neanotovaných datech mnoho vylepšila, ale když se pustí na datech anotovaných (z nichž většina stejně prošla pod rukama jedné z nás třech), udělá víc škody než užitku, tj. změní už jednou správnou anotaci na špatnou a my to znovu opravujeme. Příklad: too many - anotováno jako too.EXT a syn; automaticky "opraveno" na too.RHEM a syn (což ani nejde!), ručně se musí opravit zpět :-( 
 +Otázka - vadí nám to? Je už to na maličko datech, tak už to doopravíme, ale jednak pro přístě a jednak - nedá se na tom třeba měřit spolehlivě shoda!  
 +---- 
 +**Schůzka 12. 9. 08** 
 + 
 +1. PREC 
 +Jednoslovné výrazy, které jsou na začátku věty, jsou zpravidla správně označeny jako PREC. Zatím se v takové pozici vyskytly //and, furthermore, but, meanwhile, ultimately, still, however, thus, otherwise, yet, instead, separately, overall, then, rather.// 
 + 
 +PREC s podtržítky 
 +Jako víceslovné výrazy s podtržítkovými lemmaty se objevily některé výrazy z manuálu (//at_least, as_well//), ale i některé, které v něm nejsou (//by_contrast, on_the_other_hand//), je tedy třeba vyřešit, jak anotovat jednotlivé víceslovné výrazy a mj. to, jestli může PREC uzel mít potomky. 
 +Návrh na řešení od Marušky: 
 +Pokud je PREC uzel víceslovný s potenciálním závislým t-uzlem, tak ho 
 +tak rozebrat - (tedy "on the other hand", člen a předlozku schovat u 
 +hand.PREC, other RSTR). Pokud je to PREC víceslovný bez nároku na závislý 
 +uzel (by contrast, in contrast, in addition atd.), lema napsat s 
 +podtržítkem a předložku navíc schovat do aux. A pokud se nebudete moci 
 +rozhodnout mezi PREC a TWHEN, dejte raději TWHEN - jsou tak většinou v 
 +češtině, (meanwhile, in the meantime, so far, simultaneously...), přičemž 
 +u TWHENů nejsou podtržítka a možné předložky jdou jen do aux, ne do 
 +lematu. Pozor: pokud TWHEN neodpovídá logickému průběhu času - (jako že se 
 +řekne "zároveň" a ono je to vlastně "potom"), tak je to PREC. 
 + 
 +2. RHEM 
 +Rematizátory, které procedura ozančuje jako rematizátory, ale nejsou nikdy, nebo skoro nikdy rematizátory: //further, again, alone// 
 + 
 +LM, 5.8. 09: Kristýnin návrh na anotaci //alone//: 
 +"he did sth alone.COMPL" 
 +"he alone.RHEM did sth" 
 + 
 +Specifické rematizátory před vedlejšími větami: 
 +Jde o některé výrazy, nejčastěji s měrovým významem, které fungují jako rematizátory především před podřadicí spojkou:  
 +//partly, particularly, largely, mostly, exclusively// 
 + 
 +Příklad: Indeed , that happened to some extent yesterday , as industrial stocks rebounded , partly on news of takeovers in the paper industry . 
 +Toto se včera skutečně v určitém rozsahu stalo, když se průmyslové akcie vzchopily, částečně díky zprávám o koupích v papírovém průmyslu. 
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359&sentenceid=EnglishT-wsj_0359-s11&sentenceord=11&sentencemax=57|STROM]] 
 + 
 +Pokud jsou tyto výrazy rozvitími jmen, nebo rozvíjí přímo sloveso, fungují zpravidla jako EXT, v případech s vedlejšími větami mají zřejmě významy oba, podiskusi jsme se shodly, že jim v těchto pozicích budeme dávat fuktor RHEM. 
 + 
 +Rematizátory na konci věty: 
 +Výrazy, které se vyskytují za čárkou na konci věty, mohou být PREC nebo RHEM, podle toho, jaký mají zpětný dosah (jestli na celou větu nebo na její část). V této pozici se vyskytly //either// a //too//. 
 + 
 +Typické rematizátory s volnou pozicí: 
 +//also, only, just// 
 +Just se vyskytuje jako rematizátor velice často, daleko častěji než v časovém významu. 
 +Also funguje obousměrně, je třeba rozhodovat podle toho, jak vypadají předchozí věty, zda má dosah dopředu nebo dozadu ve větě. Jeho dosah je velice variabilní a s mnoha možnostmi interpretace, zvlášť v souvislosti s češtinou. Bude třeba ho dále sledovat. 
 + 
 +Příklad: 
 +Britain 's unsettled political scene also worries some investors . 
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359&sentenceid=EnglishT-wsj_0359-s19&sentenceord=19&sentencemax=57|STROM]] [[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359|KONTEXT]] 
 + 
 +Homonymie 
 +Některé výrazy jsou homonymní s jinými významy kvůli zanedbání následující předložky: //as_well// a //as well as//, //in_addition// a //in addition to//. 
 +Rozhodně nejde o rematizátory v případech rozvíjení jména (např //too// a //further// tady fungují jako měrová určení). 
 + 
 +Technická řešení: 
 +Pokud rematizátor závisí na modálním slovese, pod kterým je koordinace, je problém, kam ho pověsit. Na radu Marušky navrhuji, aby se v takových případech věšel rematizátor na spojku vlevo před první koordinovaný člen. 
 + 
 +Příklad:  
 +In a statement , the company said : `` Both parts can only realize their full potential and be appropriately valued *-1 by the market if they are separately quoted companies . 
 +V jednom prohlášení společnost uvedla: "Obě části mohou pouze realizovat svůj plný potenciál a mít na trhu příslušnou hodnotu, pokud to jsou společnosti zalistované odděleně. 
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=037&file=0376&sentenceid=EnglishT-wsj_0376-s14&sentenceord=14&sentencemax=16|STROM]] 
 + 
 + 
 +Při elipse se rematizátor zavěšuje na elidovanou část před uzel, který má v dosahu. 
 + 
 +Příklad: 
 +The DAX index closed at 1466.29 , up only 3.36 . 
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=037&file=0374&sentenceid=EnglishT-wsj_0374-s44&sentenceord=44&sentencemax=53|STROM]] 
 + 
 +**RHEM x EXT !!** (LM, 23.9.) 
 +Pokud se potenciální RHEM vztahuje k číselnému údaji či kvantifikátoru, je to EXT!! 
 +Např.: only a few pennies, at least ten people, (také EXT too late, too often)  
 +**???** Pozor, be largely EXT supported x be supported largely RHEM by X - různá interpretace!! - Ale nevím, zda oboje nemůže být oboje a zda ten slovosled vše rozhoduje... 
 + 
 +**dodatek k EXT** (LM, 10.10.) 
 +Pokud je pred cislem (kvantifikatorem) predlozka, ktera se da prelozit zas 
 +jen a pouze jako predlozka, (under, above, below,), bude schovana u ridiciho substantiva a to, co 
 +je predtim za svitici uzel (only, just, nevim co vsechno), bude viset jako 
 +EXT na cislu. 
 + 
 +Pokud je pred cislem (kvantifikatorem) neco, co jde prelozit taky jinak 
 +nez predlozkou (about, approximately...) (= kolem, okolo, asi, priblizne), 
 +tak to ma vlastni t-uzel s EXT (visi to na cislu), a na nem visi dalsi EXT 
 +(onlyEXT aboutEXT twoRSTR people), (at_least EXT somewhat EXT interesting 
 +RSTR).
  

[ Back to the navigation ] [ Back to the content ]