Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
external:lexemann:guidelines [2008/06/11 09:44] pavel.sidak |
external:lexemann:guidelines [2008/08/25 11:48] bejcek zpřesnění jmen |
||
---|---|---|---|
Line 4: | Line 4: | ||
==== Pravidla ==== | ==== Pravidla ==== | ||
- | == SemLex -- slovník víceslovných lexémů == | + | === SemLex -- slovník víceslovných lexémů |
* Vyhledávání | * Vyhledávání | ||
* Přidávání do slovníku | * Přidávání do slovníku | ||
Line 10: | Line 10: | ||
* je vhodné časté pojmenované entity také přidávat do slovníku, v další verzi programu to poslouží k automatické předanotaci | * je vhodné časté pojmenované entity také přidávat do slovníku, v další verzi programu to poslouží k automatické předanotaci | ||
* Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | * Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | ||
+ | * Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako '' | ||
+ | * Pro frazémy neurčitého slovního druhu (jako např. " | ||
+ | * Je-li potřeba položku smazat, použijte '' | ||
- | == Pojmenované entity == | + | === Pojmenované entity |
- | | + | **v této fázi se zabýváme jen striktně víceslovnými NE:** tedy těmi, uvnitř nichž nemá smysl ani závislostní popis, ani funktory. Jednoslovné NE se budou anotovat až v 2. fázi v TrEdu. |
- | --- | + | |
- | * TODO Sjednotit | + | Vnitřní struktura nás (prozatím) nezajímá, takže například " |
+ | |||
+ | < | ||
+ | |||
+ | ---- | ||
* **jméno** jsou jména pouze osob a zvířat\\ ke jménu osoby patří i tituly | * **jméno** jsou jména pouze osob a zvířat\\ ke jménu osoby patří i tituly | ||
* v případech jako " | * v případech jako " | ||
+ | * //profesor P. Novák// -- **jméno** je //P. Novák// | ||
+ | * //prof. Novák// -- **jméno** | ||
+ | * //princ z Walesu// -- nic (je to titul, takže to celé může být přidáno do **SemLex**u) | ||
+ | * //Železná lady// -- přidat do **SemLex**u a anotovat | ||
* **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | ||
Line 43: | Line 54: | ||
* //mezi sedadly 30 a 40// -- **X** je "// | * //mezi sedadly 30 a 40// -- **X** je "// | ||
+ | Všechna **apelativa** budeme považovat za součást entity. Hlavním důvodem je, že určují její typ. (Příklady: | ||
+ | |||
+ | === Frazémy === | ||
+ | |||
+ | Příklady toho, co už není frazém: | ||
+ | * moskevský čas | ||
+ | * antisemitská politika, rasistická politika | ||
+ | |||
+ | Eliptické užití frazému se anotuje původním frazémem, tedy například " | ||
==== K nástroji sem-ann ==== | ==== K nástroji sem-ann ==== | ||
- | * Zobrazuje-li se vlevo pod oknem s textem hvězdička (v samostatném rámečku), značí to, že soubor byl změněn a nebyl dosud uložen. | + | |
- | * Program lze spouštět také například takto: '' | + | * Program lze spouštět také například takto: '' |
=== Některé užitečné klávesy === | === Některé užitečné klávesy === | ||
Line 56: | Line 76: | ||
|F7|Previous file|//od revize 94//| | |F7|Previous file|//od revize 94//| | ||
|F8|Next file|//od revize 94//| | |F8|Next file|//od revize 94//| | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
Line 72: | Line 97: | ||
* NE typu „galerie Václava Špály“: je to místo, když se tím míní místo; ale když je tam personifikace, | * NE typu „galerie Václava Špály“: je to místo, když se tím míní místo; ale když je tam personifikace, | ||
- ano, přesně tak si to představuji. --ps | - ano, přesně tak si to představuji. --ps | ||
- | * devět sekund, pět let, 20 hodin – jde o čas ?(shodli jsme se, že „rok 1994“ značíme celé jako čas), nebo máme postupovat analogicky podle „10 metrů“ a neanotovat? | + | * devět sekund, pět let, 20 hodin – jde o čas ?(shodli jsme se, že „rok 1994“ značíme celé jako čas), nebo máme postupovat analogicky podle „10 metrů“ a neanotovat?\\ Nemůžu najít odpověď na tuto otázku -- je někde jinde? Další příklad je "únor 2002" a ten snad anotovat chceme. Ovšem stejně jako všechny předchozí příklady sestává ze dvou (a více) tektogramatických uzlů, což snad je naše kritérium... --EB |
* Problém značení variabilních frazémů (dostal x měsíců natvrdo) a nekonečně rozvinutelných frazémů (" | * Problém značení variabilních frazémů (dostal x měsíců natvrdo) a nekonečně rozvinutelných frazémů (" | ||
- // | - // | ||
- // | - // | ||
- | * //značky autorů pod článkem | + | * (víceslovné |
+ | * Případy jako //první vlna//, //druhá vlna// aj. kazdý značíme jako frazém, těch vln asi není až tak hodně, max. 10. | ||
+ | * Ve frazémech typu //přešla mne chut'// | ||
==PŠ+PV== | ==PŠ+PV== | ||
Line 86: | Line 114: | ||
* první příklad, se kterým jsem se dnes setkal: v souboru | * první příklad, se kterým jsem se dnes setkal: v souboru | ||
* další příklad: soubor ln95047_137, | * další příklad: soubor ln95047_137, | ||
+ | * dalsi priklady souboru, kdy je posledni veta zdvojena a nektere vyrazy v ni nelze anotovat: davka 14/soubor 18; 14/ | ||
+ | 14/50; 14/72; 15/22, 23 (skoro celé nelze anotovat); 16/51; 16/74; 16/134 (pv) | ||
+ | Další otázky: | ||
+ | 1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře | ||
+ | jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak? | ||
+ | 2) jak anotovat fakulty a názvy univerzit, obory apod? | ||
+ | 3) jak znacit parafraze a nekonecne mnozstvi variaci typu " | ||
+ | * Další příklad neznačitelného souboru: ln95048_045.t.gz: |