[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
external:lexemann:guidelines [2009/03/26 11:36]
bejcek doplnění k času
external:lexemann:guidelines [2009/03/27 15:48]
bejcek čísla též psaná slovy, jednotky, foreign
Line 15: Line 15:
     * Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...)     * Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...)
     * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.)     * Synonymum -- založit jako novou položku ve slovníku, ideálně propojit se svým protějškem vyplněním okénka Synonyma (vepsat buď výraz, nebo ID synonymního protějšku v SemLexu). (Pokud anotátor ví, nebo později zjistí, že protějšek ve slovníku je, vyplní ID.)
 +
  
  
Line 43: Line 44:
        - biologické názvy (brouk patří do "čeledi X, druhu Y, skupiny Z")        - biologické názvy (brouk patří do "čeledi X, druhu Y, skupiny Z")
      * //ČNB Na Příkopech// -- tím je myšlena budova, nikoli instituce, tudíž je to **objekt**      * //ČNB Na Příkopech// -- tím je myšlena budova, nikoli instituce, tudíž je to **objekt**
 +     * //2654 m n.m.//, //v tisíci metrech nad mořem// -- //"m n.m."// (i psaný slovy) je **objekt**
 +     * //Kč/hod.//, //korun za hodinu// -- **objekt**
    * **adresa**\\ problém hranice mezi **jméno**/**instituce** + **místo** a **adresa**\\ přesné pravidlo: **adresa musí obsahovat ulici a/nebo doplňující (ne-místní) údaj typu tel./PSČ/fax/e-mail**; jinak se anotuje každé zvlášť, tj. např. obvyklá forma //jméno a/nebo instituce, město// není dostatečně přesně určeno, aby to mohlo být považováno za adresu. Příklady:    * **adresa**\\ problém hranice mezi **jméno**/**instituce** + **místo** a **adresa**\\ přesné pravidlo: **adresa musí obsahovat ulici a/nebo doplňující (ne-místní) údaj typu tel./PSČ/fax/e-mail**; jinak se anotuje každé zvlášť, tj. např. obvyklá forma //jméno a/nebo instituce, město// není dostatečně přesně určeno, aby to mohlo být považováno za adresu. Příklady:
      * //Petr Novák, ÚFAL// -- **jméno**, **instituce**      * //Petr Novák, ÚFAL// -- **jméno**, **instituce**
Line 65: Line 68:
      * //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka      * //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka
      * //pět milionů// -- **X**      * //pět milionů// -- **X**
-     * //3%//, //3-7%// -- obojí **X**+     * //3%//, //3-7%//, //pět a půl procenta// -- vše **X**
    * **čas** anotujeme pouze v případě odpovědi na otázku "kdy", ne však na otázku "kolik"    * **čas** anotujeme pouze v případě odpovědi na otázku "kdy", ne však na otázku "kolik"
      * //devět sekund// -- nic (kolik)      * //devět sekund// -- nic (kolik)
Line 79: Line 82:
      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)      * //léta 1968/9//, //v sezoně 1992/1993// -- obecně záleží na tom, zda je "1980/1" je tvořeno více t-uzly (lze ověřit označkováním jedničky a klávesou F5 si nechat obarvit, co vše to zasáhlo); v tomto případě jsou to tři uzly (lomítko má vlastní uzel), takže anotovat (//"léta"// a //"v sezoně"// se každopádně neanotuje)
      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**      * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas**
 +   * **foreign** se použije až v případě, že nelze zařadit jinam -- buď jinam nepatří, nebo anotátor neví, o jakou entitu jde 
 +     * //ad hoc// -- **foreign** 
 +     * //The Jungle Book// -- **objekt**, protože anotátor ví, že je to kniha
  
 Některá **apelativa** budeme považovat za součást entity, většinu však ne. Některá **apelativa** budeme považovat za součást entity, většinu však ne.

[ Back to the navigation ] [ Back to the content ]