Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
external:lexemann:guidelines [2009/05/06 15:17] bejcek lemmatisace negovaných slov |
external:lexemann:guidelines [2009/08/10 17:29] bejcek pravopisné varianty |
| |
===== Pravidla ===== | ===== Pravidla ===== |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
* Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako ''%%***%%derived from: <ID číslo původní položky>''\\ později bude vyhledání přidáno přimo do programu (např. "zrakově postižený člověk" je odvozený od "zdravotně postižený člověk"). | * Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako ''%%***%%derived from: <ID číslo původní položky>''\\ později bude vyhledání přidáno přimo do programu (např. "zrakově postižený člověk" je odvozený od "zdravotně postižený člověk"). |
* Pro frazémy neurčitého slovního druhu (jako např. "laicky řečeno" -- asi částice?) a větné frazémy (jako přísloví) zvolte jako PoS hodnotu "N/A". | * Pro frazémy neurčitého slovního druhu (jako např. "laicky řečeno" -- asi částice?) a větné frazémy (jako přísloví) zvolte jako PoS hodnotu "N/A". |
* Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...) | * Je-li potřeba položku smazat, použijte ''%%***%%remove'' do glosy a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...) |
| * Existuje-li heslo jak v singuláru, tak v plurálu (a není pro to důvod), je potřeba tímto způsobem jedno z nich smazat. V případech jako "cenný papír", "obchodní vztah" se smaže plurál (který není ničím jiným než více kusy singuláru). V případě jako "sportovní potřeby" se singulár prakticky nepoužívá, smaže se tedy ten. |
* Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.) | * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.) |
* Při vytváření lemmatisovaného tvaru od negovaného slova platí, že se předpona "ne-" odtrhává od slova vždy -- krom případů, kdy vzniklé slovo buď neexistuje, nebo není protikladem. Existuje-li tedy jasná dvojice protikladů tvořených pomocí "ne-", pište prosím jako lemma vždy tvar bez předpony.\\ nejasný -> jasný\\ nepřijít -> přijít\\ ...\\ ale:\\ nenechavý -> nenechavý (nechavý neexistuje)\\ nemocný -> nemocný (mocný má úplně jiný význam) | * Homonymie -- v případě, že je potřeba založit druhé heslo se stejným "Základním tvarem", připište na jeho konec ":2", například "přímá volba :2". (Přímá volba se týká volby například presidenta lidem a také telefonní volby jedním tlačítkem.) |
| * Při vytváření lemmatisovaného tvaru od |
| * negovaného slova platí, že se předpona "ne-" odtrhává od slova vždy -- krom případů, kdy vzniklé slovo buď neexistuje, nebo není protikladem. Existuje-li tedy jasná dvojice protikladů tvořených pomocí "ne-", pište prosím jako lemma vždy tvar bez předpony.\\ nejasný -> jasný\\ nepřijít -> přijít\\ ...\\ ale:\\ nenechavý -> nenechavý (nechavý neexistuje)\\ nemocný -> nemocný (mocný má úplně jiný význam) |
| * výrazu s čárkou ("Ministerstvo školství**,** mládeže a tělovýchovy") se (zatím, pro konsistenci) čárka v lemmatisovaném tvaru také uvádí. |
| * Vybrané příklady: |
| * rozpočtová kapitola -- **ano** (ne každá kapitola lze říci takto s adjektivem)\\ Hypothesa: <html>Existuje-li spojení X<font size="-5">Adj</font>-Y<font size="-5">Subst</font> ("rozpočtová kapitola"), které lze obrátit na Y<font size="-5">Subst</font>-X<font size="-5">Subst</font> ("kapitola rozpočtu") s přibližně stejným významem, zatímco jiné podobné A<font size="-5">Subst</font>-B<font size="-5">Subst</font> ("kapitola zákona") na adjektivní formu převést nelze (*"zákonná kapitola"), je to dobrý důvod pro anotaci. (Případné další příklady a také protipříklady možno psát sem.)</html> |
| * diplomatická čtvrť, ekonomický náměstek, měnový výbor -- ano |
| * marketingová metoda, marketingová smlouva -- asi ne |
| * Grepl v Příruční mluvnici mluví o tom, že adjektivní spojení zastírá význam a jako příklad uvádí oblíbené knedlíky (bramborové vs. švestkové). To tedy svědčí pro to, že adjektivní varianta by se měla anotovat, neboť má zastřenější význam. |
| * imobilní občan -- **ne** (je to jako "občan, který nemůže chodit") |
| * veřejný objekt, bytový objekt -- **ano** |
| * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma "přímý úměra") |
| * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; "schodišťová plošina" (MWE) má často podobu "šikmé schodišťové plošiny" (MWE)) |
| |
| |
* //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu | * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako //nejhlubší bod na Zemi// je Mariánský příkop); //centrální banka// patří do SemLexu |
* //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu | * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým 'Z'), není to žádná pojmenovaná entita; co se týče frazémů, je to povětšinou komposicionální, možná je //státní sociální podpora// termín (nutno pro každý konkrétní případ vyhledat, vygooglit), který by se měl uložit do SemLexu |
| |
| |
| |
| |
| |
| |
| |
==== Frazémy ==== | ==== Frazémy ==== |
| |
Příklady toho, co už není frazém: | Vždy anotovat **doslova** přesně tou položkou slovníku, která je použita v textu. |
| * tedy "ministerstvo privatizace" je jiné než "privatizační ministerstvo" |
| * vyjímku tvoří: |
| * zdrobněliny: "rodinný dům" lze použít i pro anotaci "rodinného d//omku//" |
| * přechýlení: "ministr vnitra" lze použít i pro "ministr//yni// vnitra" |
| * elipsa: viz níže |
| * pravopisné varianty: "kuponová privatisace" lze použít pro "kup//ó//nová privati//z//ace" |
| * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB) |
| \\ |
| |
| Příklady toho, co už **není frazém**: |
* moskevský čas | * moskevský čas |
* antisemitská politika, rasistická politika | * antisemitská politika, rasistická politika |
| * hlavní město Rakouska (jen "hlavní město") |
| * poslední den (ze SČFI -- zrušit) |
| * principy trhu, tržní principy |
| \\ |
| |
Příklady nekomposicionálních frazémů: | Příklady **frazémů**: |
* vládní návrh | * velkosériová výroba -- je to sporné, dohodli jsme se, že ano |
| * sedmá třída |
| * ?? speciální efekt? |
| * zapsat se zlatým písmem |
| \\ |
| |
Eliptické užití frazému se anotuje původním frazémem, tedy například "zrakově postižený" je anotováno slovníkovou položkou "zrakově postižený člověk". | Příklady **nekomposicionálních** frazémů: |
| * vládní návrh |
| \\ |
| |
Parafráze a variace typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"// | **Eliptické** užití frazému se anotuje původním frazémem, tedy například "zrakově postižený" je anotováno slovníkovou položkou "zrakově postižený člověk". Podobně "první světová" anotováno "první světovou válkou". |
| * pokud po elipse zbyde jedno slovo, neanotuje se; (tj. článek o "Ministerstvu průmyslu a obchodu" se slovem "ministerstvo" na každém řádku, stejně jako o "fotbalové lize" se slovy "liga" bude mít anotovaný pouze ten plný víceslovný výraz.) |
| * výjimkou je //koordinace// typu "první a druhá světová válka", kde slovo "první" je elipsou za "první světová válka" |
| * "česká inspekce" -- zvláštnost stylu autora článku; s malým 'č' ve významu "Česká inspekce životního prostředí" (což celé je pojmenovaná entita, tedy není v SemLexu);\\ řešení: založit heslo "Česká inspekce životního prostředí", poznamenat k němu, že je to pojmenovaná entita instituce, a pak jím anotovat "českou inspekci" |
| \\ |
| |
| **Parafráze a variace** typu //"Zloději nechodí po horách, ale po domácnostech"// se vloží jako nová položka do SemLexu s poznámkou "derived" v Glosse, která odkazuje na původní //"Neštěstí nechodí po horách, ale po lidech"//. (Pokud neexistuje, tak samozřejmě nejprve ho vyrobit, pak vyrobit odvozenou variantu s odkazem na něj.) Podobně //"Ne Rudé, ale Šedé právo"//; nový význam spojení //"Sarajevský atentát"// |
| |
===== K nástroji sem-ann ===== | ===== K nástroji sem-ann ===== |