Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
external:lexemann:guidelines [2009/03/25 17:44] bejcek Doplnění adres, čísel a časů; nepojmenované entity |
external:lexemann:guidelines [2009/08/07 18:34] bejcek odchylky mezi heslem a textem |
||
---|---|---|---|
Line 2: | Line 2: | ||
===== Pravidla ===== | ===== Pravidla ===== | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
==== SemLex -- slovník víceslovných lexémů ==== | ==== SemLex -- slovník víceslovných lexémů ==== | ||
* Vyhledávání | * Vyhledávání | ||
+ | - kliknout na Hledat, nebo stisknout S | ||
+ | - vyplnit " | ||
+ | - stisknout Enter (neklikat na Hledat) | ||
+ | - Pomocí tlačítek " | ||
* Přidávání do slovníku | * Přidávání do slovníku | ||
* nejde-li něco udělat, poznamenat to do " | * nejde-li něco udělat, poznamenat to do " | ||
Line 10: | Line 24: | ||
* Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | * Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | ||
* Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako '' | * Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako '' | ||
- | * Pro frazémy neurčitého slovního druhu (jako např. " | + | * Pro frazémy neurčitého slovního druhu (jako např. " |
- | * Je-li potřeba položku smazat, použijte '' | + | * Je-li potřeba položku smazat, použijte '' |
- | + | * Existuje-li heslo jak v singuláru, tak v plurálu (a není pro to důvod), je potřeba tímto způsobem jedno z nich smazat. V případech jako " | |
+ | * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.) | ||
+ | * Homonymie -- v případě, že je potřeba založit druhé heslo se stejným " | ||
+ | * Při vytváření lemmatisovaného tvaru od | ||
+ | * negovaného slova platí, že se předpona " | ||
+ | * výrazu s čárkou (" | ||
+ | * Vybrané příklady: | ||
+ | * rozpočtová kapitola -- **ano** (ne každá kapitola lze říci takto s adjektivem)\\ Hypothesa: < | ||
+ | * imobilní občan -- **ne** (je to jako " | ||
+ | * veřejný objekt, bytový objekt -- **ano** | ||
+ | * přímá úměra, nepřímá úměra -- **ano** (obojí, není to protiklad; lemma " | ||
+ | * schodišťová plošina, šikmá schodišťová plošina -- **ano** (obojí; " | ||
Line 32: | Line 56: | ||
* //Železná lady// -- přidat do **SemLex**u a anotovat | * //Železná lady// -- přidat do **SemLex**u a anotovat | ||
* (víceslovné značky autorů pod článkem (pokud víceslovné existují) značit jako entity reprezentující jména osob) | * (víceslovné značky autorů pod článkem (pokud víceslovné existují) značit jako entity reprezentující jména osob) | ||
+ | * **instituce** | ||
+ | * //Dental, s.r.o.// celé **instituce**, | ||
+ | * __veletrhy__ a __soutěže__ jsou **instituce** (podle dokumentu " | ||
+ | |||
* **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | ||
* Spadají sem tedy: | * Spadají sem tedy: | ||
- kulturní artefakty (názvy knih, filmů, festivalů apod., předpisů, zákonů, ...) | - kulturní artefakty (názvy knih, filmů, festivalů apod., předpisů, zákonů, ...) | ||
+ | * podtitul je součástí názvu (knihy) | ||
- názvy výrobků (Intel Pentium Pro) | - názvy výrobků (Intel Pentium Pro) | ||
- názvy měn (americký dolar)((tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!)) | - názvy měn (americký dolar)((tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!)) | ||
Line 42: | Line 70: | ||
- biologické názvy (brouk patří do " | - biologické názvy (brouk patří do " | ||
* //ČNB Na Příkopech// | * //ČNB Na Příkopech// | ||
- | * **adresa**\\ problém hranice mezi **jméno**/ | + | * //2654 m n.m.//, //v tisíci metrech nad mořem// -- //"m n.m."// |
+ | * //př. K.// -- **objekt** | ||
+ | * // | ||
+ | |||
+ | * **adresa**\\ problém hranice mezi **jméno**/ | ||
* //Petr Novák, ÚFAL// -- **jméno**, **instituce** | * //Petr Novák, ÚFAL// -- **jméno**, **instituce** | ||
* // | * // | ||
Line 64: | Line 96: | ||
* //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka | * //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka | ||
* //pět milionů// -- **X** | * //pět milionů// -- **X** | ||
- | * //3%//, //3-7%// -- obojí | + | * //3%//, //3-7%//, //pět a půl procenta// -- vše **X** |
* **čas** anotujeme pouze v případě odpovědi na otázku " | * **čas** anotujeme pouze v případě odpovědi na otázku " | ||
* //devět sekund// -- nic (kolik) | * //devět sekund// -- nic (kolik) | ||
Line 75: | Line 107: | ||
* //20. století// -- v zásadě ano, ale 20 je jednoslovné => nic | * //20. století// -- v zásadě ano, ale 20 je jednoslovné => nic | ||
* //20 hodin 15 minut// -- celé **čas** | * //20 hodin 15 minut// -- celé **čas** | ||
- | * //v 1. polovině 20. století// -- nic FIXME | + | * //v 1. polovině 20. století// -- nic |
- | * // | + | * // |
* //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas** | * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas** | ||
+ | * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde | ||
+ | * //ad hoc// -- **foreign** | ||
+ | * //The Jungle Book// -- **objekt**, protože anotátor ví, že je to kniha | ||
Některá **apelativa** budeme považovat za součást entity, většinu však ne. | Některá **apelativa** budeme považovat za součást entity, většinu však ne. | ||
Line 100: | Line 134: | ||
Pojmenovanou entitou **není** nic z následujících: | Pojmenovanou entitou **není** nic z následujících: | ||
- | * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako // | + | * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako // |
* //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým ' | * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým ' | ||
+ | |||
+ | |||
+ | |||
+ | |||
==== Frazémy ==== | ==== Frazémy ==== | ||
- | Příklady toho, co už není frazém: | + | Vždy anotovat **přesně** tou položkou slovníku, která je použita v textu. |
+ | * tedy " | ||
+ | * vyjímku tvoří: | ||
+ | * zdrobněliny: | ||
+ | * přechýlení: | ||
+ | * elipsa: viz níže | ||
+ | * (Pokud jsem na něco zapomněl, připište to, nebo se zeptejte. --EB) | ||
+ | \\ | ||
+ | |||
+ | Příklady toho, co už **není frazém**: | ||
* moskevský čas | * moskevský čas | ||
* antisemitská politika, rasistická politika | * antisemitská politika, rasistická politika | ||
+ | * hlavní město Rakouska (jen " | ||
+ | * poslední den (ze SČFI -- zrušit) | ||
+ | \\ | ||
- | Příklady nekomposicionálních frazémů: | + | Příklady |
* vládní návrh | * vládní návrh | ||
+ | \\ | ||
- | Eliptické užití frazému se anotuje původním frazémem, tedy například " | + | **Eliptické** užití frazému se anotuje původním frazémem, tedy například " |
- | + | * pokud po elipse zbyde jedno slovo, neanotuje se; (tj. článek o " | |
- | Parafráze a variace typu //"Zloději nechodí | + | * výjimkou je //koordinace// |
+ | * " | ||
+ | \\ | ||
+ | **Parafráze a variace** typu //" | ||
===== K nástroji sem-ann ===== | ===== K nástroji sem-ann ===== |