[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:anotace-rematizatoru-a-konektoru [2008/08/25 15:08]
anotator
external:anotace-rematizatoru-a-konektoru [2009/08/05 12:18] (current)
anotator
Line 1: Line 1:
 ===== Anotace RHEM, PREC a CM ===== ===== Anotace RHEM, PREC a CM =====
- 
 Kristýna Č., Katka Veselá, Lucie Kristýna Č., Katka Veselá, Lucie
  
Line 6: Line 5:
   *  v něm seznam anglických PREC - revize Lucie   *  v něm seznam anglických PREC - revize Lucie
   *  navíc seznam anglických RHEM - revize Katka   *  navíc seznam anglických RHEM - revize Katka
 +
  
 === ze schůzky 14.8.08: === === ze schůzky 14.8.08: ===
Line 21: Line 21:
  
 accordingly, consequently - prozkoumá Kristýna accordingly, consequently - prozkoumá Kristýna
-so far - prozkoumá Lucie+ 
 +**so far** (LM, 23.9.) po mém hledání v Quirkovi a po slovnících je opravdu asi časové - tj. so **EXT** závislé na far **TWHEN**. Možná by se dalo uvažovat o PRECu, kdyby to v nějakém kontextu vypadalo jako "do tohoto místa v textu" či "z toho, co jsem zatím řekl". Musíme je sledovat.
  
  
  
 **Nejasné či problematické struktury a evidentní chyby** nadělané automatickými opravami v již anotovaných souborech pište **sem**  i s číslem věty. **Nejasné či problematické struktury a evidentní chyby** nadělané automatickými opravami v již anotovaných souborech pište **sem**  i s číslem věty.
 +
 +LM, 5.8.09: Pozor, automatická procedura na neanotovaných datech mnoho vylepšila, ale když se pustí na datech anotovaných (z nichž většina stejně prošla pod rukama jedné z nás třech), udělá víc škody než užitku, tj. změní už jednou správnou anotaci na špatnou a my to znovu opravujeme. Příklad: too many - anotováno jako too.EXT a syn; automaticky "opraveno" na too.RHEM a syn (což ani nejde!), ručně se musí opravit zpět :-(
 +Otázka - vadí nám to? Je už to na maličko datech, tak už to doopravíme, ale jednak pro přístě a jednak - nedá se na tom třeba měřit spolehlivě shoda! 
 +----
 +**Schůzka 12. 9. 08**
 +
 +1. PREC
 +Jednoslovné výrazy, které jsou na začátku věty, jsou zpravidla správně označeny jako PREC. Zatím se v takové pozici vyskytly //and, furthermore, but, meanwhile, ultimately, still, however, thus, otherwise, yet, instead, separately, overall, then, rather.//
 +
 +PREC s podtržítky
 +Jako víceslovné výrazy s podtržítkovými lemmaty se objevily některé výrazy z manuálu (//at_least, as_well//), ale i některé, které v něm nejsou (//by_contrast, on_the_other_hand//), je tedy třeba vyřešit, jak anotovat jednotlivé víceslovné výrazy a mj. to, jestli může PREC uzel mít potomky.
 +Návrh na řešení od Marušky:
 +Pokud je PREC uzel víceslovný s potenciálním závislým t-uzlem, tak ho
 +tak rozebrat - (tedy "on the other hand", člen a předlozku schovat u
 +hand.PREC, other RSTR). Pokud je to PREC víceslovný bez nároku na závislý
 +uzel (by contrast, in contrast, in addition atd.), lema napsat s
 +podtržítkem a předložku navíc schovat do aux. A pokud se nebudete moci
 +rozhodnout mezi PREC a TWHEN, dejte raději TWHEN - jsou tak většinou v
 +češtině, (meanwhile, in the meantime, so far, simultaneously...), přičemž
 +u TWHENů nejsou podtržítka a možné předložky jdou jen do aux, ne do
 +lematu. Pozor: pokud TWHEN neodpovídá logickému průběhu času - (jako že se
 +řekne "zároveň" a ono je to vlastně "potom"), tak je to PREC.
 +
 +2. RHEM
 +Rematizátory, které procedura ozančuje jako rematizátory, ale nejsou nikdy, nebo skoro nikdy rematizátory: //further, again, alone//
 +
 +LM, 5.8. 09: Kristýnin návrh na anotaci //alone//:
 +"he did sth alone.COMPL"
 +"he alone.RHEM did sth"
 +
 +Specifické rematizátory před vedlejšími větami:
 +Jde o některé výrazy, nejčastěji s měrovým významem, které fungují jako rematizátory především před podřadicí spojkou: 
 +//partly, particularly, largely, mostly, exclusively//
 +
 +Příklad: Indeed , that happened to some extent yesterday , as industrial stocks rebounded , partly on news of takeovers in the paper industry .
 +Toto se včera skutečně v určitém rozsahu stalo, když se průmyslové akcie vzchopily, částečně díky zprávám o koupích v papírovém průmyslu.
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359&sentenceid=EnglishT-wsj_0359-s11&sentenceord=11&sentencemax=57|STROM]]
 +
 +Pokud jsou tyto výrazy rozvitími jmen, nebo rozvíjí přímo sloveso, fungují zpravidla jako EXT, v případech s vedlejšími větami mají zřejmě významy oba, podiskusi jsme se shodly, že jim v těchto pozicích budeme dávat fuktor RHEM.
 +
 +Rematizátory na konci věty:
 +Výrazy, které se vyskytují za čárkou na konci věty, mohou být PREC nebo RHEM, podle toho, jaký mají zpětný dosah (jestli na celou větu nebo na její část). V této pozici se vyskytly //either// a //too//.
 +
 +Typické rematizátory s volnou pozicí:
 +//also, only, just//
 +Just se vyskytuje jako rematizátor velice často, daleko častěji než v časovém významu.
 +Also funguje obousměrně, je třeba rozhodovat podle toho, jak vypadají předchozí věty, zda má dosah dopředu nebo dozadu ve větě. Jeho dosah je velice variabilní a s mnoha možnostmi interpretace, zvlášť v souvislosti s češtinou. Bude třeba ho dále sledovat.
 +
 +Příklad:
 +Britain 's unsettled political scene also worries some investors .
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359&sentenceid=EnglishT-wsj_0359-s19&sentenceord=19&sentencemax=57|STROM]] [[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=035&file=0359|KONTEXT]]
 +
 +Homonymie
 +Některé výrazy jsou homonymní s jinými významy kvůli zanedbání následující předložky: //as_well// a //as well as//, //in_addition// a //in addition to//.
 +Rozhodně nejde o rematizátory v případech rozvíjení jména (např //too// a //further// tady fungují jako měrová určení).
 +
 +Technická řešení:
 +Pokud rematizátor závisí na modálním slovese, pod kterým je koordinace, je problém, kam ho pověsit. Na radu Marušky navrhuji, aby se v takových případech věšel rematizátor na spojku vlevo před první koordinovaný člen.
 +
 +Příklad: 
 +In a statement , the company said : `` Both parts can only realize their full potential and be appropriately valued *-1 by the market if they are separately quoted companies .
 +V jednom prohlášení společnost uvedla: "Obě části mohou pouze realizovat svůj plný potenciál a mít na trhu příslušnou hodnotu, pokud to jsou společnosti zalistované odděleně.
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=037&file=0376&sentenceid=EnglishT-wsj_0376-s14&sentenceord=14&sentencemax=16|STROM]]
 +
 +
 +Při elipse se rematizátor zavěšuje na elidovanou část před uzel, který má v dosahu.
 +
 +Příklad:
 +The DAX index closed at 1466.29 , up only 3.36 .
 +[[https://blackbird.ms.mff.cuni.cz/toman/pedt/?section=037&file=0374&sentenceid=EnglishT-wsj_0374-s44&sentenceord=44&sentencemax=53|STROM]]
 +
 +**RHEM x EXT !!** (LM, 23.9.)
 +Pokud se potenciální RHEM vztahuje k číselnému údaji či kvantifikátoru, je to EXT!!
 +Např.: only a few pennies, at least ten people, (také EXT too late, too often) 
 +**???** Pozor, be largely EXT supported x be supported largely RHEM by X - různá interpretace!! - Ale nevím, zda oboje nemůže být oboje a zda ten slovosled vše rozhoduje...
 +
 +**dodatek k EXT** (LM, 10.10.)
 +Pokud je pred cislem (kvantifikatorem) predlozka, ktera se da prelozit zas
 +jen a pouze jako predlozka, (under, above, below,), bude schovana u ridiciho substantiva a to, co
 +je predtim za svitici uzel (only, just, nevim co vsechno), bude viset jako
 +EXT na cislu.
 +
 +Pokud je pred cislem (kvantifikatorem) neco, co jde prelozit taky jinak
 +nez predlozkou (about, approximately...) (= kolem, okolo, asi, priblizne),
 +tak to ma vlastni t-uzel s EXT (visi to na cislu), a na nem visi dalsi EXT
 +(onlyEXT aboutEXT twoRSTR people), (at_least EXT somewhat EXT interesting
 +RSTR).
 +

[ Back to the navigation ] [ Back to the content ]