[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
external:lexemann:guidelines [2008/08/25 15:22]
bejcek úpravy anotátorských dotazů
external:lexemann:guidelines [2008/08/25 15:51]
bejcek Informace k chybě v programu přesunuty do ticketu, zde smazány
Line 1: Line 1:
 ====== Anotační instrukce ====== ====== Anotační instrukce ======
  
 +===== Pravidla =====
  
- +==== SemLex -- slovník víceslovných lexémů ====
- +
-==== Pravidla ==== +
- +
-=== SemLex -- slovník víceslovných lexémů ===+
   * Vyhledávání   * Vyhledávání
   * Přidávání do slovníku   * Přidávání do slovníku
Line 16: Line 13:
     * Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...)     * Je-li potřeba položku smazat, použijte ''%%***%%remove'' a případně připište důvod (vytvořeno omylem, duplicitní heslo, není frazémem, ...)
  
-=== Pojmenované entity ("NE") ===+==== Pojmenované entity ("NE"====
 **v této fázi se zabýváme jen striktně víceslovnými NE:** tedy těmi, uvnitř nichž nemá smysl ani závislostní popis, ani funktory. Jednoslovné NE se budou anotovat až v 2. fázi v TrEdu. Z toho důvodu neanotujeme ani jednoslovné zkratky víceslovných NE (např. ČSSD). (Pozor, KDU-ČSL má tři tektogramatické uzly, proto je (a všechny ostatní zkratky s pomlčkou, spojovníkem, či mezerou ("MFF UK")) chceme **anotovat** již v této fázi jako instituce). **v této fázi se zabýváme jen striktně víceslovnými NE:** tedy těmi, uvnitř nichž nemá smysl ani závislostní popis, ani funktory. Jednoslovné NE se budou anotovat až v 2. fázi v TrEdu. Z toho důvodu neanotujeme ani jednoslovné zkratky víceslovných NE (např. ČSSD). (Pozor, KDU-ČSL má tři tektogramatické uzly, proto je (a všechny ostatní zkratky s pomlčkou, spojovníkem, či mezerou ("MFF UK")) chceme **anotovat** již v této fázi jako instituce).
  
Line 92: Line 89:
  
  
-=== Frazémy ===+==== Frazémy ====
  
 Příklady toho, co už není frazém: Příklady toho, co už není frazém:
Line 106: Line 103:
  
  
-==== K nástroji sem-ann ====+===== K nástroji sem-ann =====
  
   * Zobrazuje-li se vlevo pod oknem s textem hvězdička (v samostatném rámečku), značí to, že soubor byl změněn a nebyl dosud uložen.   * Zobrazuje-li se vlevo pod oknem s textem hvězdička (v samostatném rámečku), značí to, že soubor byl změněn a nebyl dosud uložen.
Line 126: Line 123:
  
  
-==== Dotazy, nejasnosti ===+===== Dotazy, nejasnosti ====
 Máme několik dalších nejasností, zatím jsme se shodli na následujících řešeních: Máme několik dalších nejasností, zatím jsme se shodli na následujících řešeních:
  
Line 149: Line 146:
  
 ==PŠ+PV== ==PŠ+PV==
- 
-Ještě technický problém: občas některé lexémy naprosto nevysvětlitelně nelze označit a  program hlásí, že "vybraný text nemá smysl anotovat"(přitom to jsou ale výrazy, které prokazatelně smysl anotovat má), několikrát se to stalo i u celého souboru. (PŠ+PV) 
-  - potřebujeme přesný údaj, kde se to stalo. Jinak chybu nemůžeme opravit. (--ps) 
- 
-  * první příklad, se kterým jsem se dnes setkal: v souboru  ln95047_134.t.gz se (což se stává) opakuje poslední věta dvakrát; v obou případech nelze označit druhou půlku telefonního čísla (= součást adresy). (pš) 
-  * další příklad: soubor ln95047_137, 6. odstavec, výraz "nemocniční zařízení": lze označit jen "nemocniční", nikoli "zařízení". (pš) 
-  * dalsi priklady souboru, kdy je posledni veta zdvojena a nektere vyrazy v ni nelze anotovat: davka 14/soubor 18; 14/31;  
-14/50; 14/72; 15/22, 23 (skoro celé nelze anotovat); 16/51; 16/74; 16/134 (pv) 
  
 Další otázky:  Další otázky: 
Line 163: Line 152:
 2) jak anotovat <del>fakulty a názvy univerzit,</del> obory apod? 2) jak anotovat <del>fakulty a názvy univerzit,</del> obory apod?
 3) <del>jak znacit parafraze a nekonecne mnozstvi variaci typu "Zloději nechodí po horách, ale po domácnostech" (pv)</del> 3) <del>jak znacit parafraze a nekonecne mnozstvi variaci typu "Zloději nechodí po horách, ale po domácnostech" (pv)</del>
- 
- * Další příklad neznačitelného souboru: ln95048_045.t.gz: lze značit jen 1/2 jména Truman Capote. (PŠ) 

[ Back to the navigation ] [ Back to the content ]