[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
external:lexemann:guidelines [2007/07/08 00:23]
stranak
external:lexemann:guidelines [2008/07/03 11:16]
ufal
Line 56: Line 56:
 |F7|Previous file|//od revize 94//| |F7|Previous file|//od revize 94//|
 |F8|Next file|//od revize 94//| |F8|Next file|//od revize 94//|
 +
 +
 +
 +
  
 ==== Dotazy, nejasnosti === ==== Dotazy, nejasnosti ===
Line 76: Line 80:
  
   * //značky autorů pod článkem navrhuji značit jako entity reprezentující jména osob// (--ps)   * //značky autorů pod článkem navrhuji značit jako entity reprezentující jména osob// (--ps)
 +  * Případy jako //první vlna//, //druhá vlna// aj. kazdý značíme jako  frazém, těch vln asi není až tak hodně, max. 10.
 +  * Ve frazémech typu //přešla mne chut'// značíme jen //přejít chut'//.
 +
  
 ==PŠ+PV== ==PŠ+PV==
Line 81: Line 88:
 Ještě technický problém: občas některé lexémy naprosto nevysvětlitelně nelze označit a  program hlásí, že "vybraný text nemá smysl anotovat"(přitom to jsou ale výrazy, které prokazatelně smysl anotovat má), několikrát se to stalo i u celého souboru. (PŠ+PV) Ještě technický problém: občas některé lexémy naprosto nevysvětlitelně nelze označit a  program hlásí, že "vybraný text nemá smysl anotovat"(přitom to jsou ale výrazy, které prokazatelně smysl anotovat má), několikrát se to stalo i u celého souboru. (PŠ+PV)
   - potřebujeme přesný údaj, kde se to stalo. Jinak chybu nemůžeme opravit. (--ps)   - potřebujeme přesný údaj, kde se to stalo. Jinak chybu nemůžeme opravit. (--ps)
 +
 +  * první příklad, se kterým jsem se dnes setkal: v souboru  ln95047_134.t.gz se (což se stává) opakuje poslední věta dvakrát; v obou případech nelze označit druhou půlku telefonního čísla (= součást adresy). (pš)
 +  * další příklad: soubor ln95047_137, 6. odstavec, výraz "nemocniční zařízení": lze označit jen "nemocniční", nikoli "zařízení". (pš)
 +  * dalsi priklady souboru, kdy je posledni veta zdvojena a nektere vyrazy v ni nelze anotovat: davka 14/soubor 18; 14/31; 
 +14/50; 14/72; 15/22, 23 (skoro celé nelze anotovat); 16/51; 16/74; 16/134 (pv)
 +
 +Další otázky: 
 +1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře
 + jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak?
 +2) jak anotovat fakulty a názvy univerzit, obory apod?
 +3) jak znacit parafraze a nekonecne mnozstvi variaci typu "Zloději nechodí po horách, ale po domácnostech" (pv)
  
  

[ Back to the navigation ] [ Back to the content ]