Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
external:lexemann:guidelines [2008/08/29 13:49] bejcek opravení FIXME |
external:lexemann:guidelines [2009/03/27 15:50] bejcek podtitul |
||
---|---|---|---|
Line 2: | Line 2: | ||
===== Pravidla ===== | ===== Pravidla ===== | ||
+ | |||
+ | |||
==== SemLex -- slovník víceslovných lexémů ==== | ==== SemLex -- slovník víceslovných lexémů ==== | ||
Line 12: | Line 14: | ||
* Pro frazémy neurčitého slovního druhu (jako např. " | * Pro frazémy neurčitého slovního druhu (jako např. " | ||
* Je-li potřeba položku smazat, použijte '' | * Je-li potřeba položku smazat, použijte '' | ||
+ | * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.) | ||
+ | |||
+ | |||
Line 34: | Line 39: | ||
* Spadají sem tedy: | * Spadají sem tedy: | ||
- kulturní artefakty (názvy knih, filmů, festivalů apod., předpisů, zákonů, ...) | - kulturní artefakty (názvy knih, filmů, festivalů apod., předpisů, zákonů, ...) | ||
+ | * podtitul je součástí názvu (knihy) | ||
- názvy výrobků (Intel Pentium Pro) | - názvy výrobků (Intel Pentium Pro) | ||
- názvy měn (americký dolar)((tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!)) | - názvy měn (americký dolar)((tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!)) | ||
Line 40: | Line 46: | ||
- biologické názvy (brouk patří do " | - biologické názvy (brouk patří do " | ||
* //ČNB Na Příkopech// | * //ČNB Na Příkopech// | ||
+ | * //2654 m n.m.//, //v tisíci metrech nad mořem// -- //"m n.m."// | ||
+ | * // | ||
* **adresa**\\ problém hranice mezi **jméno**/ | * **adresa**\\ problém hranice mezi **jméno**/ | ||
* //Petr Novák, ÚFAL// -- **jméno**, **instituce** | * //Petr Novák, ÚFAL// -- **jméno**, **instituce** | ||
Line 48: | Line 56: | ||
* //Petr Novák, ÚFAL, Malostranské náměstí 25// -- **adresa** | * //Petr Novák, ÚFAL, Malostranské náměstí 25// -- **adresa** | ||
* //Svoboda, 777 578 975// -- **adresa** | * //Svoboda, 777 578 975// -- **adresa** | ||
+ | * //kontakt: 777 578 975// -- v tomto případě je to celé **adresa**, neboť " | ||
+ | * //kontakt: 777 578 975, e-mail pepa@ufal.cz, | ||
+ | * //č.ú.: 4328-483859392054/ | ||
* //jdu do galerie Václava Špály// -- **místo** | * //jdu do galerie Václava Špály// -- **místo** | ||
* //Galerie Václava Špály koupila obraz// -- **instituce**, | * //Galerie Václava Špály koupila obraz// -- **instituce**, | ||
Line 58: | Line 69: | ||
* //mezi sedadly 30 a 40// -- **X** je "// | * //mezi sedadly 30 a 40// -- **X** je "// | ||
* //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka | * //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka | ||
+ | * //pět milionů// -- **X** | ||
+ | * //3%//, //3-7%//, //pět a půl procenta// -- vše **X** | ||
* **čas** anotujeme pouze v případě odpovědi na otázku " | * **čas** anotujeme pouze v případě odpovědi na otázku " | ||
* //devět sekund// -- nic (kolik) | * //devět sekund// -- nic (kolik) | ||
* //pět let// -- nic (kolik) | * //pět let// -- nic (kolik) | ||
* //20 hodin// -- udává-li období => nic; udává-li večerní čas => 20 by byl **čas**, ale je to jednoslovné => také nic | * //20 hodin// -- udává-li období => nic; udává-li večerní čas => 20 by byl **čas**, ale je to jednoslovné => také nic | ||
- | * //rok 1994// -- FIXME **čas** | + | * //rok 1994// -- nic |
* //únor 2002// -- **čas** | * //únor 2002// -- **čas** | ||
* //počátek září 1974// -- //" | * //počátek září 1974// -- //" | ||
Line 68: | Line 81: | ||
* //20. století// -- v zásadě ano, ale 20 je jednoslovné => nic | * //20. století// -- v zásadě ano, ale 20 je jednoslovné => nic | ||
* //20 hodin 15 minut// -- celé **čas** | * //20 hodin 15 minut// -- celé **čas** | ||
- | * //v 1. polovině 20. století// -- nic FIXME | + | * //v 1. polovině 20. století// -- nic |
- | * //léta 1980/1// -- FIXME | + | * // |
+ | * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas** | ||
+ | * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde | ||
+ | * //ad hoc// -- **foreign** | ||
+ | * //The Jungle Book// -- **objekt**, protože anotátor ví, že je to kniha | ||
- | Všechna | + | Některá |
+ | Apelativa, která budeme anotovat spolu s entitou, jsou vesměs geografické výrazy, vždy tvoří součást názvu (vynechání lze pak považovat spíše za elipsu), | ||
+ | Příklady: "ulice Politických vězňů", | ||
+ | naopak neanotujeme apelativa | ||
* // | * // | ||
* // | * // | ||
Line 80: | Line 99: | ||
* // | * // | ||
* //kapela Doors// -- nic (anotovalo by se jen jednoslovné //Doors//) | * //kapela Doors// -- nic (anotovalo by se jen jednoslovné //Doors//) | ||
- | * //turnaj U.S. Open// -- FIXME | + | * //turnaj U.S. Open// -- jen U.S. Open jako objekt |
* //chrám sv. Václava// -- celé | * //chrám sv. Václava// -- celé | ||
* //pan Novák// -- nic | * //pan Novák// -- nic | ||
- | * //ulice pplk. Sochora// -- FIXME jsou součástí pojmenovaných entit - ano --ps | + | * //ulice pplk. Sochora// -- celé |
- | * // | + | * // |
- | * //zákon o daních// -- celé FIXME | + | * //zákon o daních// -- celé (pokud je to název jednoho konkrétního zákona) |
- | * //podle zákona 1456/18, Sb.// -- bez //" | + | * //podle zákona 1456/18, Sb.// -- bez //" |
+ | Pojmenovanou entitou **není** nic z následujících: | ||
+ | * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako // | ||
+ | * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým ' | ||
==== Frazémy ==== | ==== Frazémy ==== |