[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
external:lexemann:guidelines [2009/08/07 18:34]
bejcek odchylky mezi heslem a textem
external:lexemann:guidelines [2009/09/18 20:01]
bejcek vidové dvojice, citáty, speciální valence
Line 2: Line 2:
  
 ===== Pravidla ===== ===== Pravidla =====
 +
  
  
Line 33: Line 34:
       * výrazu s čárkou ("Ministerstvo školství**,** mládeže a tělovýchovy") se (zatím, pro konsistenci) čárka v lemmatisovaném tvaru také uvádí.       * výrazu s čárkou ("Ministerstvo školství**,** mládeže a tělovýchovy") se (zatím, pro konsistenci) čárka v lemmatisovaném tvaru také uvádí.
     * Vybrané příklady:     * Vybrané příklady:
-      * rozpočtová kapitola -- **ano** (ne každá kapitola lze říci takto s adjektivem)\\ Hypothesa: <html>Existuje-li spojení X<font size="-5">Adj</font>-Y<font size="-5">Subst</font> ("rozpočtová kapitola"), které lze obrátit na Y<font size="-5">Subst</font>-X<font size="-5">Subst</font> ("kapitola rozpočtu") s přibližně stejným významem, zatímco jiné podobné A<font size="-5">Subst</font>-B<font size="-5">Subst</font> ("kapitola zákona") na adjektivní formu převést nelze (*"zákonná kapitola"), je to dobrý důvod pro anotaci. (Případné další příklady a také protipříklady možno psát sem.)</html>\\ Grepl v Příruční mluvnici mluví o tom, že adjektivní spojení zastírá význam a jako příklad uvádí oblíbené knedlíky (bramborové vs. švestkové). To tedy svědčí pro to, že adjektivní varianta by se měla anotovat, neboť má zastřenější význam.+      * rozpočtová kapitola -- **ano** (ne každá kapitola lze říci takto s adjektivem)\\ Hypothesa: <html>Existuje-li spojení X<font size="-5">Adj</font>-Y<font size="-5">Subst</font> ("rozpočtová kapitola"), které lze obrátit na Y<font size="-5">Subst</font>-X<font size="-5">Subst</font> ("kapitola rozpočtu") s přibližně stejným významem, zatímco jiné podobné A<font size="-5">Subst</font>-B<font size="-5">Subst</font> ("kapitola zákona") na adjektivní formu převést nelze (*"zákonná kapitola"), je to dobrý důvod pro anotaci. (Případné další příklady a také protipříklady možno psát sem.)</html> 
 +        * diplomatická čtvrť, ekonomický náměstek, měnový výbor -- ano 
 +        * marketingová metoda, marketingová smlouva -- asi ne 
 +        * Grepl v Příruční mluvnici mluví o tom, že adjektivní spojení zastírá význam a jako příklad uvádí oblíbené knedlíky (bramborové vs. švestkové). To tedy svědčí pro to, že adjektivní varianta by se měla anotovat, neboť má zastřenější význam.
       * imobilní občan -- **ne** (je to jako "občan, který nemůže chodit")       * imobilní občan -- **ne** (je to jako "občan, který nemůže chodit")
       * veřejný objekt, bytový objekt -- **ano**       * veřejný objekt, bytový objekt -- **ano**
       * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma "přímý úměra")       * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma "přímý úměra")
       * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; "schodišťová plošina" (MWE) má často podobu "šikmé schodišťové plošiny" (MWE))       * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; "schodišťová plošina" (MWE) má často podobu "šikmé schodišťové plošiny" (MWE))
 +
  
  
Line 110: Line 115:
      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)
      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**
 +     * //od září do dubna// -- nic, není to absolutní udání času (které září)
    * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde    * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde
      * //ad hoc// -- **foreign**      * //ad hoc// -- **foreign**
Line 136: Line 142:
   * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu   * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu
   * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu   * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu
 +
 +
 +
 +
  
  
Line 143: Line 153:
 ==== Frazémy ==== ==== Frazémy ====
  
-Vždy anotovat **přesně** tou položkou slovníku, která je použita v textu. +Vždy anotovat **doslova** přesně tou položkou slovníku, která je použita v textu. 
-  * tedy "ministerstvo privatizace" je jiné než "privatizační ministerstvo"; "tržní principy" jsou jiné heslo než "principy trhu" [pokud vůbec existují]+  * tedy "ministerstvo privatizace" je jiné než "privatizační ministerstvo"
   * vyjímku tvoří:   * vyjímku tvoří:
-    * zdrobněliny: "rodinný dům" lze použít i pro anotaci "rodinného domku+    * zdrobněliny: "rodinný dům" lze použít i pro anotaci "rodinného d//omku//
-    * přechýlení: "ministr vnitra" lze použít i pro "ministryni vnitra"+    * přechýlení: "ministr vnitra" lze použít i pro "ministr//yni// vnitra"
     * elipsa: viz níže     * elipsa: viz níže
 +    * pravopisné varianty: "kuponová privatisace" lze použít pro "kup//ó//nová privati//z//ace"
 +    * vidové dvojice: "zneužití pravomoci veřejného činitele" lze anotovat pomocí "zneužívání pr. veř. čin."
     * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB)     * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB)
 \\ \\
Line 157: Line 169:
   * hlavní město Rakouska (jen "hlavní město")   * hlavní město Rakouska (jen "hlavní město")
   * poslední den (ze SČFI -- zrušit)   * poslední den (ze SČFI -- zrušit)
 +  * principy trhu, tržní principy
 +\\
 +
 +Příklady **frazémů**:
 +  * velkosériová výroba -- je to sporné, dohodli jsme se, že ano
 +  * sedmá třída
 +  * ?? speciální efekt?
 +  * zapsat se zlatým písmem
 \\ \\
  
Line 170: Line 190:
  
 **Parafráze a variace** typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"// **Parafráze a variace** typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"//
 +
 +**Citáty** a ustálené věty typu //"Hvězdné nebe nad námi a mravní zákon v nás"// či //"Čo bolo, to bolo, terazky som majorom"// anotovat a zakládat pro ně ve slovníku hesla. (Do oblasti našeho zájmu spadají jen tím, jak jsou ustrnulá a nesubstituovatelná apod., nicméně jiná anotace je také nezachycuje.) Obměny citátů stejně jako obměny přísloví výše.
 +
 +V **idiomatických, leč jednoslovných** slovesných konstrukcích typu //"zapsat si další asistenci"//, či //"kéž by to tam padalo"// lze variovat vše krom slovesa. Jsou už podchycena PDT-VALLEXem a my je **neanotujeme**.
 +
 +=== problematické ===
 +
 +**zákony:** pridavna slova jako "vladni" a "novela" neanotovat.
 +Problem je, jak (a ktery) zakon anotovat. Vubec, jako NE, SemLexem.
 +
 +  * Pridrzet se pravidla o objektech [[guidelines#pojmenovane-entity-ne|vyse]]: tedy nazvy, ktere oznacuji jeden konkretni zakon, anotovat jako NE. (Tomu je vzdy kvivalentni vlozit ho do slovniku a vyznacit, ze je to ''%%***%%objekt''.)
 +  * V druhe rade se ridit poznámkou slecny Stastne,((slovnik je plny souslovi, ktera se prinejmensim zdaji byt kompozicionalni, ovsem nelze na nich provest substitucni test *ministerstvo peneznich prostredku  *zakon o odvodech statu (=zakon o danich) )) totiz zkontrolovat substituovatelnost (prip. komposicionalitu). To se bude tykat asi i delsich zakonu. [Pozor, zda nahodou neni frazemem jen cast celeho vyrazu. Souhlasim se "*zakonem o odvodech statu", ale domnivam se, ze "*zakon o pridavcich na nezletile" nam nerika nic o zakone, ale jen o "pridavcich na deti".]
 +  * Pokud ani jedno neplati, nevidim nutnost to anotovat. (Leda byste to chtely mit ve slovníku, stejne jako ostatni zakony, ktere uz v nem jsou.) V techto pripadech bych to nechal na vasem uvazeni. Anotujte konsistentne a pripadne (casem) zformulujte pravidlo, kterym se ridite.
 +
 +
 +**trestné činy:** Spojeni "trestny cin" asi neni (na rozdil od zakona) soucasti nazvu, viz treba [[http://zakony.kurzy.cz/140-1961-trestni-zakon/cast-2-hlava-3/|Zneužívání pravomoci veřejného činitele]]
 +Anotujte tedy "trestny cin" zvlast a v pripade, ze nasleduje neco, co do slovniku dat chcete, tak to tam pridejte samostatne, tedy treba to "zneuziti pravomoci verejneho cinitele". Tedy:
 +  * "trestny cin vrazdy" -- anotovat jen "trestny cin"
 +  * "trestny cin zneuziti pravomoci verejneho cinitele" -- zvlast 2 MWE
 +  * "trestny cin pokusu o vrazdu" -- pouze "trestny cin" (pokud se vam na rozdil od nas nezda "pokus o vrazdu" nejak zajimavy)
 +  * "obvinen z pokusu o vrazdu" -- nic
  
 ===== K nástroji sem-ann ===== ===== K nástroji sem-ann =====

[ Back to the navigation ] [ Back to the content ]