[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
external:lexemann:guidelines [2009/04/09 16:57]
stastna
external:lexemann:guidelines [2009/08/07 19:10]
bejcek frazémy
Line 2: Line 2:
  
 ===== Pravidla ===== ===== Pravidla =====
 +
 +
 +
 +
 +
 +
 +
 +
  
  
Line 7: Line 15:
 ==== SemLex -- slovník víceslovných lexémů ==== ==== SemLex -- slovník víceslovných lexémů ====
   * Vyhledávání   * Vyhledávání
 +    - kliknout na Hledat, nebo stisknout S
 +    - vyplnit "Základní tvar", nebo "Lemmatizovaný tvar"
 +    - stisknout Enter (neklikat na Hledat)
 +    - Pomocí tlačítek "P" a "N" (či pomocí Ctrl-p a Ctrl-n) vybrat z více možností tu požadovanou, nebo pomocí roletkového menu Základní tvar (nefunguje vždy dobře, viz ticket #79)
   * Přidávání do slovníku   * Přidávání do slovníku
     * nejde-li něco udělat, poznamenat to do "glosa" a označit třemi hvězdičkami (tedy ''%%***%%poznámka'') k dalšímu ručnímu posouzení     * nejde-li něco udělat, poznamenat to do "glosa" a označit třemi hvězdičkami (tedy ''%%***%%poznámka'') k dalšímu ručnímu posouzení
Line 12: Line 24:
       * Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ ''%%***%%(jméno)''\\ ''%%***%%(instituce)''\\ ''%%***%%(místo)''\\ ''%%***%%(objekt)''\\ ''%%***%%(foreign)''.       * Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ ''%%***%%(jméno)''\\ ''%%***%%(instituce)''\\ ''%%***%%(místo)''\\ ''%%***%%(objekt)''\\ ''%%***%%(foreign)''.
     * Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako ''%%***%%derived from: <ID číslo původní položky>''\\ později bude vyhledání přidáno přimo do programu (např. "zrakově postižený člověk" je odvozený od "zdravotně postižený člověk").     * Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako ''%%***%%derived from: <ID číslo původní položky>''\\ později bude vyhledání přidáno přimo do programu (např. "zrakově postižený člověk" je odvozený od "zdravotně postižený člověk").
-    * Pro frazémy neurčitého slovního druhu (jako např. "laicky řečeno" -- asi částice?) a větné frazémy (jako přísloví) bude možno v příští verzi vybrat N/A. +    * Pro frazémy neurčitého slovního druhu (jako např. "laicky řečeno" -- asi částice?) a větné frazémy (jako přísloví) zvolte jako PoS hodnotu "N/A"
-    * Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...)+    * Je-li potřeba položku smazat, použijte ''%%***%%remove'' do glosy a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...) 
 +      * Existuje-li heslo jak v singuláru, tak v plurálu (a není pro to důvod), je potřeba tímto způsobem jedno z nich smazat. V případech jako "cenný papír", "obchodní vztah" se smaže plurál (který není ničím jiným než více kusy singuláru). V případě jako "sportovní potřeby" se singulár prakticky nepoužívá, smaže se tedy ten.
     * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.)     * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.)
- +    * Homonymie -- v případě, že je potřeba založit druhé heslo se stejným "Základním tvarem", připište na jeho konec ":2", například "přímá volba :2". (Přímá volba se týká volby například presidenta lidem a také telefonní volby jedním tlačítkem.) 
- +    * Při vytváření lemmatisovaného tvaru od 
 +      * negovaného slova platí, že se předpona "ne-" odtrhává od slova vždy -- krom případů, kdy vzniklé slovo buď neexistuje, nebo není protikladem. Existuje-li tedy jasná dvojice protikladů tvořených pomocí "ne-", pište prosím jako lemma vždy tvar bez předpony.\\ nejasný -> jasný\\ nepřijít -> přijít\\ ...\\ ale:\\ nenechavý -> nenechavý (nechavý neexistuje)\\ nemocný -> nemocný (mocný má úplně jiný význam) 
 +      * výrazu s čárkou ("Ministerstvo školství**,** mládeže a tělovýchovy") se (zatím, pro konsistenci) čárka v lemmatisovaném tvaru také uvádí. 
 +    * Vybrané příklady: 
 +      * rozpočtová kapitola -- **ano** (ne každá kapitola lze říci takto s adjektivem)\\ Hypothesa: <html>Existuje-li spojení X<font size="-5">Adj</font>-Y<font size="-5">Subst</font> ("rozpočtová kapitola"), které lze obrátit na Y<font size="-5">Subst</font>-X<font size="-5">Subst</font> ("kapitola rozpočtu") s přibližně stejným významem, zatímco jiné podobné A<font size="-5">Subst</font>-B<font size="-5">Subst</font> ("kapitola zákona") na adjektivní formu převést nelze (*"zákonná kapitola"), je to dobrý důvod pro anotaci. (Případné další příklady a také protipříklady možno psát sem.)</html>\\ Grepl v Příruční mluvnici mluví o tom, že adjektivní spojení zastírá význam a jako příklad uvádí oblíbené knedlíky (bramborové vs. švestkové). To tedy svědčí pro to, že adjektivní varianta by se měla anotovat, neboť má zastřenější význam. 
 +      * imobilní občan -- **ne** (je to jako "občan, který nemůže chodit"
 +      * veřejný objekt, bytový objekt -- **ano** 
 +      * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma "přímý úměra"
 +      * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; "schodišťová plošina" (MWE) má často podobu "šikmé schodišťové plošiny" (MWE))
  
  
Line 38: Line 58:
    * **instituce**     * **instituce** 
         * //Dental, s.r.o.// celé **instituce**, ovšem pouze když je to zkratkou (jako prof. Novák)         * //Dental, s.r.o.// celé **instituce**, ovšem pouze když je to zkratkou (jako prof. Novák)
 +        * __veletrhy__ a __soutěže__ jsou **instituce** (podle dokumentu "Skupiny pojmenovaných entit")
                
    * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**.     * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. 
Line 115: Line 136:
   * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu   * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu
   * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu   * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu
 +
 +
 +
 +
 +
  
 ==== Frazémy ==== ==== Frazémy ====
  
-Příklady toho, co už není frazém:+Vždy anotovat **doslova** přesně tou položkou slovníku, která je použita v textu. 
 +  * tedy "ministerstvo privatizace" je jiné než "privatizační ministerstvo" 
 +  * vyjímku tvoří: 
 +    * zdrobněliny: "rodinný dům" lze použít i pro anotaci "rodinného domku" 
 +    * přechýlení: "ministr vnitra" lze použít i pro "ministryni vnitra" 
 +    * elipsa: viz níže 
 +    * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB) 
 +\\ 
 + 
 +Příklady toho, co už **není frazém**:
   * moskevský čas   * moskevský čas
   * antisemitská politika, rasistická politika   * antisemitská politika, rasistická politika
 +  * hlavní město Rakouska (jen "hlavní město")
 +  * poslední den (ze SČFI -- zrušit)
 +\\
  
-Příklady nekomposicionálních frazémů: +Příklady **frazémů**
-  * vládní návrh+  * velkosériová výroba -- je to sporné, dohodli jsme se, že ano 
 +  * sedmá třída 
 +  * ?? speciální efekt? 
 +\\
  
-Eliptické užití frazému se anotuje původním frazémem, tedy například "zrakově postižený" je anotováno slovníkovou položkou "zrakově postižený člověk".+Příklady **nekomposicionálních** frazémů: 
 +  * vládní návrh 
 +\\
  
-Parafráze a variace typu //"Zloději nechodí po horáchale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derivedv Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//(Pokud neexistujetak samozřejmě nejprve ho vyrobitpak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudéale Šedé právo"//nový význam spojení //"Sarajevský atentát"//+**Eliptické** užití frazému se anotuje původním frazémemtedy například "zrakově postižený" je anotováno slovníkovou položkou "zrakově postižený člověk". Podobně "první světová" anotováno "první světovou válkou". 
 +  * pokud po elipse zbyde jedno slovoneanotuje se; (tj. článek o "Ministerstvu průmyslu a obchodu" se slovem "ministerstvo" na každém řádkustejně jako o "fotbalové lize" se slovy "liga" bude mít anotovaný pouze ten plný víceslovný výraz.) 
 +    * výjimkou je //koordinace// typu "první a druhá světová válka", kde slovo "první" je elipsou za "první světová válka" 
 +  * "česká inspekce" -- zvláštnost stylu autora článkus malým 'č' ve významu "Česká inspekce životního prostředí(což celé je pojmenovaná entita, tedy není v SemLexu);\\ řešení: založit heslo "Česká inspekce životního prostředí", poznamenat k němu, že je to pojmenovaná entita instituce, a pak jím anotovat "českou inspekci" 
 +\\
  
 +**Parafráze a variace** typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"//
  
 ===== K nástroji sem-ann ===== ===== K nástroji sem-ann =====

[ Back to the navigation ] [ Back to the content ]