Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
external:lexemann:guidelines [2007/07/08 00:14] stranak |
external:lexemann:guidelines [2008/07/10 12:39] bejcek Doplnění pravidel |
||
---|---|---|---|
Line 4: | Line 4: | ||
==== Pravidla ==== | ==== Pravidla ==== | ||
- | == SemLex -- slovník víceslovných lexémů == | + | === SemLex -- slovník víceslovných lexémů |
* Vyhledávání | * Vyhledávání | ||
* Přidávání do slovníku | * Přidávání do slovníku | ||
Line 10: | Line 10: | ||
* je vhodné časté pojmenované entity také přidávat do slovníku, v další verzi programu to poslouží k automatické předanotaci | * je vhodné časté pojmenované entity také přidávat do slovníku, v další verzi programu to poslouží k automatické předanotaci | ||
* Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | * Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | ||
+ | * Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako '' | ||
+ | * Pro frazémy neurčitého slovního druhu (jako např. " | ||
- | == Pojmenované entity == | + | === Pojmenované entity |
- | | + | **v této fázi se zabýváme jen striktně víceslovnými NE:** tedy těmi, uvnitř nichž nemá smysl ani závislostní popis, ani funktory. Jednoslovné NE se budou anotovat až v 2. fázi v TrEdu. |
- | --- | + | |
- | * TODO Sjednotit | + | Vnitřní struktura nás (prozatím) nezajímá, takže například " |
+ | |||
+ | ---- | ||
* **jméno** jsou jména pouze osob a zvířat\\ ke jménu osoby patří i tituly | * **jméno** jsou jména pouze osob a zvířat\\ ke jménu osoby patří i tituly | ||
Line 43: | Line 47: | ||
* //mezi sedadly 30 a 40// -- **X** je "// | * //mezi sedadly 30 a 40// -- **X** je "// | ||
+ | === Frazémy === | ||
+ | |||
+ | Příklady toho, co už není frazém: | ||
+ | * moskevský čas | ||
+ | * antisemitská politika, rasistická politika | ||
+ | |||
+ | Eliptické užití frazému se anotuje původním frazémem, tedy například " | ||
==== K nástroji sem-ann ==== | ==== K nástroji sem-ann ==== | ||
- | * Zobrazuje-li se vlevo pod oknem s textem hvězdička (v samostatném rámečku), značí to, že soubor byl změněn a nebyl dosud uložen. | + | |
- | * Program lze spouštět také například takto: '' | + | * Program lze spouštět také například takto: '' |
=== Některé užitečné klávesy === | === Některé užitečné klávesy === | ||
Line 56: | Line 67: | ||
|F7|Previous file|//od revize 94//| | |F7|Previous file|//od revize 94//| | ||
|F8|Next file|//od revize 94//| | |F8|Next file|//od revize 94//| | ||
+ | |||
+ | |||
+ | |||
+ | |||
==== Dotazy, nejasnosti === | ==== Dotazy, nejasnosti === | ||
Line 75: | Line 90: | ||
- // | - // | ||
- | | + | |
+ | * Případy jako //první vlna//, //druhá vlna// aj. kazdý značíme jako frazém, těch vln asi není až tak hodně, max. 10. | ||
+ | * Ve frazémech typu //přešla mne chut'// | ||
- | PŠ+PV | + | |
+ | ==PŠ+PV== | ||
Ještě technický problém: občas některé lexémy naprosto nevysvětlitelně nelze označit a program hlásí, že " | Ještě technický problém: občas některé lexémy naprosto nevysvětlitelně nelze označit a program hlásí, že " | ||
- potřebujeme přesný údaj, kde se to stalo. Jinak chybu nemůžeme opravit. (--ps) | - potřebujeme přesný údaj, kde se to stalo. Jinak chybu nemůžeme opravit. (--ps) | ||
+ | |||
+ | * první příklad, se kterým jsem se dnes setkal: v souboru | ||
+ | * další příklad: soubor ln95047_137, | ||
+ | * dalsi priklady souboru, kdy je posledni veta zdvojena a nektere vyrazy v ni nelze anotovat: davka 14/soubor 18; 14/ | ||
+ | 14/50; 14/72; 15/22, 23 (skoro celé nelze anotovat); 16/51; 16/74; 16/134 (pv) | ||
+ | |||
+ | Další otázky: | ||
+ | 1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře | ||
+ | jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak? | ||
+ | 2) jak anotovat fakulty a názvy univerzit, obory apod? | ||
+ | 3) jak znacit parafraze a nekonecne mnozstvi variaci typu " | ||