[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
external:lexemann:guidelines [2009/03/26 11:36]
bejcek doplnění k času
external:lexemann:guidelines [2009/04/09 16:57]
stastna
Line 15: Line 15:
     * Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...)     * Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...)
     * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.)     * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.)
 +
 +
 +
  
  
Line 33: Line 36:
      * //Železná lady// -- přidat do **SemLex**u a anotovat      * //Železná lady// -- přidat do **SemLex**u a anotovat
      * (víceslovné značky autorů pod článkem (pokud víceslovné existují) značit jako entity reprezentující jména osob)      * (víceslovné značky autorů pod článkem (pokud víceslovné existují) značit jako entity reprezentující jména osob)
 +   * **instituce**  
 +        * //Dental, s.r.o.// celé **instituce**, ovšem pouze když je to zkratkou (jako prof. Novák) 
 +       
    * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**.     * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. 
      * Spadají sem tedy:      * Spadají sem tedy:
        - kulturní artefakty (názvy knih, filmů, festivalů apod., předpisů, zákonů, ...)        - kulturní artefakty (názvy knih, filmů, festivalů apod., předpisů, zákonů, ...)
 +         * podtitul je součástí názvu (knihy)
        - názvy výrobků (Intel Pentium Pro)        - názvy výrobků (Intel Pentium Pro)
        - názvy měn (americký dolar)((tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!))        - názvy měn (americký dolar)((tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!))
Line 43: Line 49:
        - biologické názvy (brouk patří do "čeledi X, druhu Y, skupiny Z")        - biologické názvy (brouk patří do "čeledi X, druhu Y, skupiny Z")
      * //ČNB Na Příkopech// -- tím je myšlena budova, nikoli instituce, tudíž je to **objekt**      * //ČNB Na Příkopech// -- tím je myšlena budova, nikoli instituce, tudíž je to **objekt**
-   * **adresa**\\ problém hranice mezi **jméno**/**instituce** + **místo** a **adresa**\\ přesné pravidlo: **adresa musí obsahovat ulici a/nebo doplňující (ne-místní) údaj typu tel./PSČ/fax/e-mail**; jinak se anotuje každé zvlášť, tj. např. obvyklá forma //jméno a/nebo instituce, město// není dostatečně přesně určeno, aby to mohlo být považováno za adresu. Příklady:+     * //2654 m n.m.//, //v tisíci metrech nad mořem// -- //"m n.m."// (i psaný slovy) je **objekt** 
 +     * //př. K.// -- **objekt** 
 +     * //Kč/hod.//, //korun za hodinu// -- **objekt** 
 + 
 +* **adresa**\\ problém hranice mezi **jméno**/**instituce** + **místo** a **adresa**\\ přesné pravidlo: **adresa musí obsahovat ulici a/nebo doplňující (ne-místní) údaj typu tel./PSČ/fax/e-mail**; jinak se anotuje každé zvlášť, tj. např. obvyklá forma //jméno a/nebo instituce, město// není dostatečně přesně určeno, aby to mohlo být považováno za adresu. Příklady:
      * //Petr Novák, ÚFAL// -- **jméno**, **instituce**      * //Petr Novák, ÚFAL// -- **jméno**, **instituce**
      * //Worchester & sons, New Haven, Connecticut// -- **instituce**, **místo**      * //Worchester & sons, New Haven, Connecticut// -- **instituce**, **místo**
Line 65: Line 75:
      * //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka      * //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka
      * //pět milionů// -- **X**      * //pět milionů// -- **X**
-     * //3%//, //3-7%// -- obojí **X**+     * //3%//, //3-7%//, //pět a půl procenta// -- vše **X**
    * **čas** anotujeme pouze v případě odpovědi na otázku "kdy", ne však na otázku "kolik"    * **čas** anotujeme pouze v případě odpovědi na otázku "kdy", ne však na otázku "kolik"
      * //devět sekund// -- nic (kolik)      * //devět sekund// -- nic (kolik)
Line 79: Line 89:
      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)
      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**
 +   * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde 
 +     * //ad hoc// -- **foreign** 
 +     * //The Jungle Book// -- **objekt**, protože anotátor ví, že je to kniha
  
 Některá **apelativa** budeme považovat za součást entity, většinu však ne. Některá **apelativa** budeme považovat za součást entity, většinu však ne.

[ Back to the navigation ] [ Back to the content ]