[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:lexemann:guidelines [2009/08/10 17:29]
bejcek pravopisné varianty
external:lexemann:guidelines [2013/12/05 15:35] (current)
bejcek oprava formátování
Line 2: Line 2:
  
 ===== Pravidla ===== ===== Pravidla =====
 +
  
  
Line 42: Line 43:
       * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma "přímý úměra")       * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma "přímý úměra")
       * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; "schodišťová plošina" (MWE) má často podobu "šikmé schodišťové plošiny" (MWE))       * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; "schodišťová plošina" (MWE) má často podobu "šikmé schodišťové plošiny" (MWE))
 +    * Položky ze SČFI nemají vyplněn PoS. Doplňujte ho, když takové slovníkové heslo použijete.
  
  
Line 63: Line 65:
         * //Dental, s.r.o.// celé **instituce**, ovšem pouze když je to zkratkou (jako prof. Novák)         * //Dental, s.r.o.// celé **instituce**, ovšem pouze když je to zkratkou (jako prof. Novák)
         * __veletrhy__ a __soutěže__ jsou **instituce** (podle dokumentu "Skupiny pojmenovaných entit")         * __veletrhy__ a __soutěže__ jsou **instituce** (podle dokumentu "Skupiny pojmenovaných entit")
-       +
    * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**.     * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. 
      * Spadají sem tedy:      * Spadají sem tedy:
Line 78: Line 80:
      * //Kč/hod.//, //korun za hodinu// -- **objekt**      * //Kč/hod.//, //korun za hodinu// -- **objekt**
  
-* **adresa**\\ problém hranice mezi **jméno**/**instituce** + **místo** a **adresa**\\ přesné pravidlo: **adresa musí obsahovat ulici a/nebo doplňující (ne-místní) údaj typu tel./PSČ/fax/e-mail**; jinak se anotuje každé zvlášť, tj. např. obvyklá forma //jméno a/nebo instituce, město// není dostatečně přesně určeno, aby to mohlo být považováno za adresu. Příklady:+   * **adresa**\\ problém hranice mezi **jméno**/**instituce** + **místo** a **adresa**\\ přesné pravidlo: **adresa musí obsahovat ulici a/nebo doplňující (ne-místní) údaj typu tel./PSČ/fax/e-mail**; jinak se anotuje každé zvlášť, tj. např. obvyklá forma //jméno a/nebo instituce, město// není dostatečně přesně určeno, aby to mohlo být považováno za adresu. Příklady:
      * //Petr Novák, ÚFAL// -- **jméno**, **instituce**      * //Petr Novák, ÚFAL// -- **jméno**, **instituce**
      * //Worchester & sons, New Haven, Connecticut// -- **instituce**, **místo**      * //Worchester & sons, New Haven, Connecticut// -- **instituce**, **místo**
Line 114: Line 116:
      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)
      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**
 +     * //od září do dubna// -- nic, není to absolutní udání času (které září)
    * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde    * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde
      * //ad hoc// -- **foreign**      * //ad hoc// -- **foreign**
Line 140: Line 143:
   * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu   * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu
   * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu   * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu
 +
 +
 +
 +
 +
 +
  
  
Line 156: Line 165:
     * elipsa: viz níže     * elipsa: viz níže
     * pravopisné varianty: "kuponová privatisace" lze použít pro "kup//ó//nová privati//z//ace"     * pravopisné varianty: "kuponová privatisace" lze použít pro "kup//ó//nová privati//z//ace"
 +    * vidové dvojice: "zneuž//ití// pravomoci veřejného činitele" lze anotovat pomocí "zneužívání pr. veř. čin."
 +    * překlep/chyba autora textu: "ministr //průmyslu a obchodu//" se anotuje "ministrem obchodu a průmyslu", ačkoli autor prohodil pořadí slov
 +    * zkratky: "kriminální film" se použije také pro "//krim.// film"; podobně "dok. film"...
     * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB)     * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB)
 \\ \\
Line 165: Line 177:
   * poslední den (ze SČFI -- zrušit)   * poslední den (ze SČFI -- zrušit)
   * principy trhu, tržní principy   * principy trhu, tržní principy
 +  * //sekundární předložky:// vzhledem k, s ohledem na, ... (již předanotované sek. předl. mazat)
 \\ \\
  
Line 172: Line 185:
   * ?? speciální efekt?   * ?? speciální efekt?
   * zapsat se zlatým písmem   * zapsat se zlatým písmem
 +  * na sklad -- adverbium
 +  * z tohoto mraku pršet nemusí (PoS: N/A) (případně jako %%***%%derived, pokud má anotátor pocit, že originál zní jinak, třeba "...pršet nebude")
 +  * "převzetí záštity" (%%***%%derived od "převzít záštitu", morfologická derivace)
 \\ \\
  
Line 185: Line 201:
  
 **Parafráze a variace** typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"// **Parafráze a variace** typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"//
 +
 +**Citáty** a ustálené věty typu //"Hvězdné nebe nad námi a mravní zákon v nás"// či //"Čo bolo, to bolo, terazky som majorom"// anotovat a zakládat pro ně ve slovníku hesla. (Do oblasti našeho zájmu spadají jen tím, jak jsou ustrnulá a nesubstituovatelná apod., nicméně jiná anotace je také nezachycuje.) Obměny citátů stejně jako obměny přísloví výše.
 +
 +V **idiomatických, leč jednoslovných** slovesných konstrukcích typu //"zapsat si další asistenci"//, či //"kéž by to tam padalo"// lze variovat vše krom slovesa. Jsou už podchycena PDT-VALLEXem a my je **neanotujeme**.
 +
 +=== problematické ===
 +
 +**zákony:** pridavna slova jako "vladni" a "novela" neanotovat.
 +Problem je, jak (a ktery) zakon anotovat. Vubec, jako NE, SemLexem.
 +
 +  * Pridrzet se pravidla o objektech [[guidelines#pojmenovane-entity-ne|vyse]]: tedy nazvy, ktere oznacuji jeden konkretni zakon, anotovat jako NE. (Tomu je vzdy kvivalentni vlozit ho do slovniku a vyznacit, ze je to ''%%***%%objekt''.)
 +  * V druhe rade se ridit poznámkou slecny Stastne,((slovnik je plny souslovi, ktera se prinejmensim zdaji byt kompozicionalni, ovsem nelze na nich provest substitucni test *ministerstvo peneznich prostredku  *zakon o odvodech statu (=zakon o danich) )) totiz zkontrolovat substituovatelnost (prip. komposicionalitu). To se bude tykat asi i delsich zakonu. [Pozor, zda nahodou neni frazemem jen cast celeho vyrazu. Souhlasim se "*zakonem o odvodech statu", ale domnivam se, ze "*zakon o pridavcich na nezletile" nam nerika nic o zakone, ale jen o "pridavcich na deti".]
 +  * Pokud ani jedno neplati, nevidim nutnost to anotovat. (Leda byste to chtely mit ve slovníku, stejne jako ostatni zakony, ktere uz v nem jsou.) V techto pripadech bych to nechal na vasem uvazeni. Anotujte konsistentne a pripadne (casem) zformulujte pravidlo, kterym se ridite.
 +
 +
 +**trestné činy:** Spojeni "trestny cin" asi neni (na rozdil od zakona) soucasti nazvu, viz treba [[http://zakony.kurzy.cz/140-1961-trestni-zakon/cast-2-hlava-3/|Zneužívání pravomoci veřejného činitele]]
 +Anotujte tedy "trestny cin" zvlast a v pripade, ze nasleduje neco, co do slovniku dat chcete, tak to tam pridejte samostatne, tedy treba to "zneuziti pravomoci verejneho cinitele". Tedy:
 +  * "trestny cin vrazdy" -- anotovat jen "trestny cin"
 +  * "trestny cin zneuziti pravomoci verejneho cinitele" -- zvlast 2 MWE
 +  * "trestny cin pokusu o vrazdu" -- pouze "trestny cin" (pokud se vam na rozdil od nas nezda "pokus o vrazdu" nejak zajimavy)
 +  * "obvinen z pokusu o vrazdu" -- nic
  
 ===== K nástroji sem-ann ===== ===== K nástroji sem-ann =====
Line 236: Line 273:
 2) jak anotovat <del>fakulty a názvy univerzit,</del> obory apod? 2) jak anotovat <del>fakulty a názvy univerzit,</del> obory apod?
 3) <del>jak znacit parafraze a nekonecne mnozstvi variaci typu "Zloději nechodí po horách, ale po domácnostech" (pv)</del> 3) <del>jak znacit parafraze a nekonecne mnozstvi variaci typu "Zloději nechodí po horách, ale po domácnostech" (pv)</del>
 +
 +==otázky E. Šťastné (únor 2009)==
 +únor 2009; odpovědi P. Straňák + P. Šidák
 +
 +  - Jaká je řekněme lingvistická definice toho, co mám pojmenovávat? Víceslovná vlastní jména? Chápu to správně, že se neoznačují všechna víceslovná pojmenování, ale prostě jen to, co začíná velkým písmenem? Proč?  co dělat s příklady, kdy nejde o vlastní jméno, jako "americké ministerstvo zahraničí rozhodlo" - vše s malým, nic?; "arabská čtvrť v Jeruzalémě" - nic?, "izraelsko-palestinská smlouva byla podepsána"? A co dělat s pojmenováními, která mají před sebou adjektivum, takže malé písmeno ("jižní Čechy")
 +    * čistě lingvistickou definici nelze dát, neboť se pohybujeme i mimo pole lingvistiky (např. kategorie "adresa" či "bibliografický údaj" jsou extralingvistické); "izraelsko-pal. smlouva" se značit NEBUDE; značila by se jen v případě, kdyby byla psána s velkým písmenem (tam by pak pravopis naznačoval, že jde o vlastní jméno -> objekt; viz bod 4);
 +  - jde o funkci nebo lexikální jednotku? - př: "společnosti, které mají v České republice obchodní zastoupení" - ČR je zde místo? x "Česká republika zaujala postoj" -  instituce?  - je cílem spíše určit lex. jednotku jako příslušnou k jednomu určení, nebo postihnout všecny způsoby užití?
 +    * v tomto případě je nutné lišit význam "místo" (bude se vyskytovat méně často) a "instituce" - v případě personifikace, resp. synekdochy (bude se vyskytovat výrazně častěji);
 +  - apelativa jsou součástí NE pouze u místních názvů, nebo všude? P. Šidák říká jen u místních názvů, v Instrukcích jsou i příklady typu "kniha Babička". Znamená to, že mám anotovat všechna apelativa následovaná propriem (agentura Reuters, pivovar Radegast...)?  s tím také souvisí otázka, zda se "funkce" skutečně neanotují ("český ministr školství, mladeže a tělovýchovy Ivan Pilip" . anotuji jen Ivan Pilip - jméno?)
 +    * výrazy, jejichž součástí je proprium a apelativum. Tento problém je obtížný, záleží na (diskrétní) míře kolokace. Nicméně shodli jsme se na obecném pravidle, že tyto výrazy se značit NEBUDOU (substituční zkouška: lze říci nejen "kniha Babička", ale i "román Babička", "tisková kancelář Reuters" namísto "agentury Reuters" apod.); v případě toho minstra školství se značí toto zvlášť a I. Pilip jako jméno;
 +  - co národy? "sudetští Němci, bosenští Srbové" - anotuji? jako co?
 +    * sudetští Němci a bosenští Srbové jendoznačně ano. Nelze ovšem dát čistě lingvistické zdůvodnění. Shodli jsme se na tom, že tyto termíny mají jakýsi příznak (hisotriografického, kulturologického, sociologického apod.) termínu, a měly by proto být značeny (stejně jako např. "hřib dubový" nebo "elegické distichon"). - - Shodli jsme se na tom, že anotátor vychází iz obecného (P. Straňák říká intersubjektivního, já říkám "encyklopedického" ve smyslu U. Eca) ponětí: co je všeobecně známo jakožto termín, označuje se j. objekt (případ hřibu dubového apod.); v případě Mnichovské dohody je tedy primární fakt, že "všichni" "víme", že je to něco jedinečného, terminologizovaného, a až sekudnární fakt, že se píše s maiuskulí.\\ Anotátor se má tedy držet tohoto obecného povědomí; a i pokud - kdyby např. byl historick specializovaný na izraelsko-palestinské konflikty - věděl, že ta "izraelsko-p." smlouva je jedinčená, a tedy by se měla psát s maiuskulí (a je jen chyba, že tak psána není), a tedy by se měla značit, značit ji NEBUDE, neboť není součástí tohoto obecného povědomí.
 +  - zkratky se neanotují, pokud jsou "jednoslovné" - co mám dělat se zkratkami autorů článků? v Instrukcích se sice píše, že anotovat, ale je mi to divné, jak mám vědět, čeho je to zkratka?)
 +    * bod "5" záleží na stromech - vyřeší P. Straňák.
  
 [[oldlines|Starší pravidla]] (používaná do 23. 7. 2008). [[oldlines|Starší pravidla]] (používaná do 23. 7. 2008).

[ Back to the navigation ] [ Back to the content ]