Table of Contents

Anotační instrukce

Pravidla

SemLex -- slovník víceslovných lexémů

Pojmenované entity ("NE")

v této fázi se zabýváme jen striktně víceslovnými NE: tedy těmi, uvnitř nichž nemá smysl ani závislostní popis, ani funktory. Jednoslovné NE se budou anotovat až v 2. fázi v TrEdu. Z toho důvodu neanotujeme ani jednoslovné zkratky víceslovných NE (např. ČSSD). (Pozor, KDU-ČSL má tři tektogramatické uzly, proto je (a všechny ostatní zkratky s pomlčkou, spojovníkem, či mezerou (“MFF UK”)) chceme anotovat již v této fázi jako instituce).

Vnitřní struktura nás (prozatím) nezajímá, takže například “Astronomický ústav Univerzity Karlovy v Praze” anotujeme jako jednu jedinou instituci.

V současné podobě jsou instrukce (zejména v oblasti apelativ) někdy až protichůdné. Neznajíce dobré řešení, zveřejňujeme je alespoň tak a řešení zkusíme zkonsultovat s prací O. Krůzy.


Některá apelativa budeme považovat za součást entity, většinu však ne.
Apelativa, která budeme anotovat spolu s entitou, jsou vesměs geografické výrazy, vždy tvoří součást názvu (vynechání lze pak považovat spíše za elipsu), určují typ entity.
Příklady: “ulice Politických vězňů”, “náměstí Míru”, “Staroměstské náměstí”, “chrám sv. Víta”, “Štefánikův most”, “most Legií”, “dům U třech slunců”
naopak neanotujeme apelativa “kniha Babička”, kapela, turnaj, společnost apod. (nejsou-li s jistotou součástí názvu – v tom případě by měla být psána s velkým písmenem).

Pojmenovanou entitou není nic z následujících:

Frazémy

Vždy anotovat doslova přesně tou položkou slovníku, která je použita v textu.


Příklady toho, co už není frazém:


Příklady frazémů:


Příklady nekomposicionálních frazémů:


Eliptické užití frazému se anotuje původním frazémem, tedy například “zrakově postižený” je anotováno slovníkovou položkou “zrakově postižený člověk”. Podobně “první světová” anotováno “první světovou válkou”.


Parafráze a variace typu “Zloději nechodí po horách, ale po domácnostech” se vloží jako nová položka do SemLexu s poznámkou “derived” v Glosse, která odkazuje na původní “Neštěstí nechodí po horách, ale po lidech”. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně “Ne Rudé, ale Šedé právo”; nový význam spojení “Sarajevský atentát”

Citáty a ustálené věty typu “Hvězdné nebe nad námi a mravní zákon v nás” či “Čo bolo, to bolo, terazky som majorom” anotovat a zakládat pro ně ve slovníku hesla. (Do oblasti našeho zájmu spadají jen tím, jak jsou ustrnulá a nesubstituovatelná apod., nicméně jiná anotace je také nezachycuje.) Obměny citátů stejně jako obměny přísloví výše.

V idiomatických, leč jednoslovných slovesných konstrukcích typu “zapsat si další asistenci”, či “kéž by to tam padalo” lze variovat vše krom slovesa. Jsou už podchycena PDT-VALLEXem a my je neanotujeme.

problematické

zákony: pridavna slova jako “vladni” a “novela” neanotovat.
Problem je, jak (a ktery) zakon anotovat. Vubec, jako NE, SemLexem.

trestné činy: Spojeni “trestny cin” asi neni (na rozdil od zakona) soucasti nazvu, viz treba Zneužívání pravomoci veřejného činitele
Anotujte tedy “trestny cin” zvlast a v pripade, ze nasleduje neco, co do slovniku dat chcete, tak to tam pridejte samostatne, tedy treba to “zneuziti pravomoci verejneho cinitele”. Tedy:

K nástroji sem-ann

Některé užitečné klávesy

Ctrl-uUndou jako undo
Ctrl-yRedoy je vedle u
F5Refresh textu a přebarvenídle browserů
F7Previous fileod revize 94
F8Next fileod revize 94

Dotazy, nejasnosti

Máme několik dalších nejasností, zatím jsme se shodli na následujících řešeních:

PŠ+PV

Další otázky:
1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře
jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak?
2) jak anotovat fakulty a názvy univerzit, obory apod?
3) jak znacit parafraze a nekonecne mnozstvi variaci typu “Zloději nechodí po horách, ale po domácnostech” (pv)

otázky E. Šťastné (únor 2009)

únor 2009; odpovědi P. Straňák + P. Šidák

  1. Jaká je řekněme lingvistická definice toho, co mám pojmenovávat? Víceslovná vlastní jména? Chápu to správně, že se neoznačují všechna víceslovná pojmenování, ale prostě jen to, co začíná velkým písmenem? Proč? co dělat s příklady, kdy nejde o vlastní jméno, jako “americké ministerstvo zahraničí rozhodlo” - vše s malým, nic?; “arabská čtvrť v Jeruzalémě” - nic?, “izraelsko-palestinská smlouva byla podepsána”? A co dělat s pojmenováními, která mají před sebou adjektivum, takže malé písmeno (“jižní Čechy”)
    • čistě lingvistickou definici nelze dát, neboť se pohybujeme i mimo pole lingvistiky (např. kategorie “adresa” či “bibliografický údaj” jsou extralingvistické); “izraelsko-pal. smlouva” se značit NEBUDE; značila by se jen v případě, kdyby byla psána s velkým písmenem (tam by pak pravopis naznačoval, že jde o vlastní jméno → objekt; viz bod 4);
  2. jde o funkci nebo lexikální jednotku? - př: “společnosti, které mají v České republice obchodní zastoupení” - ČR je zde místo? x “Česká republika zaujala postoj” - instituce? - je cílem spíše určit lex. jednotku jako příslušnou k jednomu určení, nebo postihnout všecny způsoby užití?
    • v tomto případě je nutné lišit význam “místo” (bude se vyskytovat méně často) a “instituce” - v případě personifikace, resp. synekdochy (bude se vyskytovat výrazně častěji);
  3. apelativa jsou součástí NE pouze u místních názvů, nebo všude? P. Šidák říká jen u místních názvů, v Instrukcích jsou i příklady typu “kniha Babička”. Znamená to, že mám anotovat všechna apelativa následovaná propriem (agentura Reuters, pivovar Radegast…)? s tím také souvisí otázka, zda se “funkce” skutečně neanotují (“český ministr školství, mladeže a tělovýchovy Ivan Pilip” . anotuji jen Ivan Pilip - jméno?)
    • výrazy, jejichž součástí je proprium a apelativum. Tento problém je obtížný, záleží na (diskrétní) míře kolokace. Nicméně shodli jsme se na obecném pravidle, že tyto výrazy se značit NEBUDOU (substituční zkouška: lze říci nejen “kniha Babička”, ale i “román Babička”, “tisková kancelář Reuters” namísto “agentury Reuters” apod.); v případě toho minstra školství se značí toto zvlášť a I. Pilip jako jméno;
  4. co národy? “sudetští Němci, bosenští Srbové” - anotuji? jako co?
    • sudetští Němci a bosenští Srbové jendoznačně ano. Nelze ovšem dát čistě lingvistické zdůvodnění. Shodli jsme se na tom, že tyto termíny mají jakýsi příznak (hisotriografického, kulturologického, sociologického apod.) termínu, a měly by proto být značeny (stejně jako např. “hřib dubový” nebo “elegické distichon”). - - Shodli jsme se na tom, že anotátor vychází iz obecného (P. Straňák říká intersubjektivního, já říkám “encyklopedického” ve smyslu U. Eca) ponětí: co je všeobecně známo jakožto termín, označuje se j. objekt (případ hřibu dubového apod.); v případě Mnichovské dohody je tedy primární fakt, že “všichni” “víme”, že je to něco jedinečného, terminologizovaného, a až sekudnární fakt, že se píše s maiuskulí.
      Anotátor se má tedy držet tohoto obecného povědomí; a i pokud - kdyby např. byl historick specializovaný na izraelsko-palestinské konflikty - věděl, že ta “izraelsko-p.” smlouva je jedinčená, a tedy by se měla psát s maiuskulí (a je jen chyba, že tak psána není), a tedy by se měla značit, značit ji NEBUDE, neboť není součástí tohoto obecného povědomí.
  5. zkratky se neanotují, pokud jsou “jednoslovné” - co mám dělat se zkratkami autorů článků? v Instrukcích se sice píše, že anotovat, ale je mi to divné, jak mám vědět, čeho je to zkratka?)
    • bod “5” záleží na stromech - vyřeší P. Straňák.

Starší pravidla (používaná do 23. 7. 2008).

1)
tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!
2)
viz pozn. 1
3)
slovnik je plny souslovi, ktera se prinejmensim zdaji byt kompozicionalni, ovsem nelze na nich provest substitucni test *ministerstvo peneznich prostredku *zakon o odvodech statu (=zakon o danich)