Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
external:lexemann:guidelines [2009/06/23 15:21] bejcek |
external:lexemann:guidelines [2009/10/12 19:22] bejcek vzhledem k, na sklad, z mraku prset nebude |
| |
===== Pravidla ===== | ===== Pravidla ===== |
| |
| |
| |
| |
| |
| |
| |
| |
| |
* Existuje-li heslo jak v singuláru, tak v plurálu (a není pro to důvod), je potřeba tímto způsobem jedno z nich smazat. V případech jako "cenný papír", "obchodní vztah" se smaže plurál (který není ničím jiným než více kusy singuláru). V případě jako "sportovní potřeby" se singulár prakticky nepoužívá, smaže se tedy ten. | * Existuje-li heslo jak v singuláru, tak v plurálu (a není pro to důvod), je potřeba tímto způsobem jedno z nich smazat. V případech jako "cenný papír", "obchodní vztah" se smaže plurál (který není ničím jiným než více kusy singuláru). V případě jako "sportovní potřeby" se singulár prakticky nepoužívá, smaže se tedy ten. |
* Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.) | * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.) |
* Homonymie -- v případě, že je potřeba založit druhé heslo se stejným "Základním tvarem", připište na jeho konec ":2", například "přímá volba :2". | * Homonymie -- v případě, že je potřeba založit druhé heslo se stejným "Základním tvarem", připište na jeho konec ":2", například "přímá volba :2". (Přímá volba se týká volby například presidenta lidem a také telefonní volby jedním tlačítkem.) |
* Při vytváření lemmatisovaného tvaru od | * Při vytváření lemmatisovaného tvaru od |
* negovaného slova platí, že se předpona "ne-" odtrhává od slova vždy -- krom případů, kdy vzniklé slovo buď neexistuje, nebo není protikladem. Existuje-li tedy jasná dvojice protikladů tvořených pomocí "ne-", pište prosím jako lemma vždy tvar bez předpony.\\ nejasný -> jasný\\ nepřijít -> přijít\\ ...\\ ale:\\ nenechavý -> nenechavý (nechavý neexistuje)\\ nemocný -> nemocný (mocný má úplně jiný význam) | * negovaného slova platí, že se předpona "ne-" odtrhává od slova vždy -- krom případů, kdy vzniklé slovo buď neexistuje, nebo není protikladem. Existuje-li tedy jasná dvojice protikladů tvořených pomocí "ne-", pište prosím jako lemma vždy tvar bez předpony.\\ nejasný -> jasný\\ nepřijít -> přijít\\ ...\\ ale:\\ nenechavý -> nenechavý (nechavý neexistuje)\\ nemocný -> nemocný (mocný má úplně jiný význam) |
* výrazu s čárkou ("Ministerstvo školství**,** mládeže a tělovýchovy") se (zatím, pro konsistenci) čárka v lemmatisovaném tvaru také uvádí. | * výrazu s čárkou ("Ministerstvo školství**,** mládeže a tělovýchovy") se (zatím, pro konsistenci) čárka v lemmatisovaném tvaru také uvádí. |
* Vybrané příklady: | * Vybrané příklady: |
* rozpočtová kapitola -- **ano** (ne každá kapitola lze říci takto s adjektivem) | * rozpočtová kapitola -- **ano** (ne každá kapitola lze říci takto s adjektivem)\\ Hypothesa: <html>Existuje-li spojení X<font size="-5">Adj</font>-Y<font size="-5">Subst</font> ("rozpočtová kapitola"), které lze obrátit na Y<font size="-5">Subst</font>-X<font size="-5">Subst</font> ("kapitola rozpočtu") s přibližně stejným významem, zatímco jiné podobné A<font size="-5">Subst</font>-B<font size="-5">Subst</font> ("kapitola zákona") na adjektivní formu převést nelze (*"zákonná kapitola"), je to dobrý důvod pro anotaci. (Případné další příklady a také protipříklady možno psát sem.)</html> |
| * diplomatická čtvrť, ekonomický náměstek, měnový výbor -- ano |
| * marketingová metoda, marketingová smlouva -- asi ne |
| * Grepl v Příruční mluvnici mluví o tom, že adjektivní spojení zastírá význam a jako příklad uvádí oblíbené knedlíky (bramborové vs. švestkové). To tedy svědčí pro to, že adjektivní varianta by se měla anotovat, neboť má zastřenější význam. |
* imobilní občan -- **ne** (je to jako "občan, který nemůže chodit") | * imobilní občan -- **ne** (je to jako "občan, který nemůže chodit") |
* veřejný objekt, bytový objekt -- **ano** | * veřejný objekt, bytový objekt -- **ano** |
* přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad) | * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma "přímý úměra") |
| * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; "schodišťová plošina" (MWE) má často podobu "šikmé schodišťové plošiny" (MWE)) |
| * Položky ze SČFI nemají vyplněn PoS. Doplňujte ho, když takové slovníkové heslo použijete. |
| |
| |
| |
* //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje) | * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje) |
* //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas** | * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas** |
| * //od září do dubna// -- nic, není to absolutní udání času (které září) |
* **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde | * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde |
* //ad hoc// -- **foreign** | * //ad hoc// -- **foreign** |
* //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu | * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu |
* //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu | * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
==== Frazémy ==== | ==== Frazémy ==== |
| |
Příklady toho, co už není frazém: | Vždy anotovat **doslova** přesně tou položkou slovníku, která je použita v textu. |
| * tedy "ministerstvo privatizace" je jiné než "privatizační ministerstvo" |
| * vyjímku tvoří: |
| * zdrobněliny: "rodinný dům" lze použít i pro anotaci "rodinného d//omku//" |
| * přechýlení: "ministr vnitra" lze použít i pro "ministr//yni// vnitra" |
| * elipsa: viz níže |
| * pravopisné varianty: "kuponová privatisace" lze použít pro "kup//ó//nová privati//z//ace" |
| * vidové dvojice: "zneuž//ití// pravomoci veřejného činitele" lze anotovat pomocí "zneužívání pr. veř. čin." |
| * překlep/chyba autora textu: "ministr //průmyslu a obchodu//" se anotuje "ministrem obchodu a průmyslu", ačkoli autor prohodil pořadí slov |
| * zkratky: "kriminální film" se použije také pro "//krim.// film"; podobně "dok. film"... |
| * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB) |
| \\ |
| |
| Příklady toho, co už **není frazém**: |
* moskevský čas | * moskevský čas |
* antisemitská politika, rasistická politika | * antisemitská politika, rasistická politika |
| * hlavní město Rakouska (jen "hlavní město") |
| * poslední den (ze SČFI -- zrušit) |
| * principy trhu, tržní principy |
| * //sekundární předložky:// vzhledem k, s ohledem na, ... (již předanotované sek. předl. mazat) |
| \\ |
| |
Příklady nekomposicionálních frazémů: | Příklady **frazémů**: |
| * velkosériová výroba -- je to sporné, dohodli jsme se, že ano |
| * sedmá třída |
| * ?? speciální efekt? |
| * zapsat se zlatým písmem |
| * na sklad -- adverbium |
| * z tohoto mraku pršet nemusí (případně jako %%***%%derived, pokud má anotátor pocit, že originál zní jinak, třeba "...pršet nebude") |
| \\ |
| |
| Příklady **nekomposicionálních** frazémů: |
* vládní návrh | * vládní návrh |
| \\ |
| |
| **Eliptické** užití frazému se anotuje původním frazémem, tedy například "zrakově postižený" je anotováno slovníkovou položkou "zrakově postižený člověk". Podobně "první světová" anotováno "první světovou válkou". |
| * pokud po elipse zbyde jedno slovo, neanotuje se; (tj. článek o "Ministerstvu průmyslu a obchodu" se slovem "ministerstvo" na každém řádku, stejně jako o "fotbalové lize" se slovy "liga" bude mít anotovaný pouze ten plný víceslovný výraz.) |
| * výjimkou je //koordinace// typu "první a druhá světová válka", kde slovo "první" je elipsou za "první světová válka" |
| * "česká inspekce" -- zvláštnost stylu autora článku; s malým 'č' ve významu "Česká inspekce životního prostředí" (což celé je pojmenovaná entita, tedy není v SemLexu);\\ řešení: založit heslo "Česká inspekce životního prostředí", poznamenat k němu, že je to pojmenovaná entita instituce, a pak jím anotovat "českou inspekci" |
| \\ |
| |
| **Parafráze a variace** typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"// |
| |
| **Citáty** a ustálené věty typu //"Hvězdné nebe nad námi a mravní zákon v nás"// či //"Čo bolo, to bolo, terazky som majorom"// anotovat a zakládat pro ně ve slovníku hesla. (Do oblasti našeho zájmu spadají jen tím, jak jsou ustrnulá a nesubstituovatelná apod., nicméně jiná anotace je také nezachycuje.) Obměny citátů stejně jako obměny přísloví výše. |
| |
| V **idiomatických, leč jednoslovných** slovesných konstrukcích typu //"zapsat si další asistenci"//, či //"kéž by to tam padalo"// lze variovat vše krom slovesa. Jsou už podchycena PDT-VALLEXem a my je **neanotujeme**. |
| |
| === problematické === |
| |
| **zákony:** pridavna slova jako "vladni" a "novela" neanotovat. |
| Problem je, jak (a ktery) zakon anotovat. Vubec, jako NE, SemLexem. |
| |
Eliptické užití frazému se anotuje původním frazémem, tedy například "zrakově postižený" je anotováno slovníkovou položkou "zrakově postižený člověk". | * Pridrzet se pravidla o objektech [[guidelines#pojmenovane-entity-ne|vyse]]: tedy nazvy, ktere oznacuji jeden konkretni zakon, anotovat jako NE. (Tomu je vzdy kvivalentni vlozit ho do slovniku a vyznacit, ze je to ''%%***%%objekt''.) |
| * V druhe rade se ridit poznámkou slecny Stastne,((slovnik je plny souslovi, ktera se prinejmensim zdaji byt kompozicionalni, ovsem nelze na nich provest substitucni test *ministerstvo peneznich prostredku *zakon o odvodech statu (=zakon o danich) )) totiz zkontrolovat substituovatelnost (prip. komposicionalitu). To se bude tykat asi i delsich zakonu. [Pozor, zda nahodou neni frazemem jen cast celeho vyrazu. Souhlasim se "*zakonem o odvodech statu", ale domnivam se, ze "*zakon o pridavcich na nezletile" nam nerika nic o zakone, ale jen o "pridavcich na deti".] |
| * Pokud ani jedno neplati, nevidim nutnost to anotovat. (Leda byste to chtely mit ve slovníku, stejne jako ostatni zakony, ktere uz v nem jsou.) V techto pripadech bych to nechal na vasem uvazeni. Anotujte konsistentne a pripadne (casem) zformulujte pravidlo, kterym se ridite. |
| |
Parafráze a variace typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"// | |
| |
| **trestné činy:** Spojeni "trestny cin" asi neni (na rozdil od zakona) soucasti nazvu, viz treba [[http://zakony.kurzy.cz/140-1961-trestni-zakon/cast-2-hlava-3/|Zneužívání pravomoci veřejného činitele]] |
| Anotujte tedy "trestny cin" zvlast a v pripade, ze nasleduje neco, co do slovniku dat chcete, tak to tam pridejte samostatne, tedy treba to "zneuziti pravomoci verejneho cinitele". Tedy: |
| * "trestny cin vrazdy" -- anotovat jen "trestny cin" |
| * "trestny cin zneuziti pravomoci verejneho cinitele" -- zvlast 2 MWE |
| * "trestny cin pokusu o vrazdu" -- pouze "trestny cin" (pokud se vam na rozdil od nas nezda "pokus o vrazdu" nejak zajimavy) |
| * "obvinen z pokusu o vrazdu" -- nic |
| |
===== K nástroji sem-ann ===== | ===== K nástroji sem-ann ===== |