Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
external:lexemann:guidelines [2008/08/25 14:57] bejcek další doplnění pravidel, časové NE |
external:lexemann:guidelines [2008/08/25 15:22] bejcek úpravy anotátorských dotazů |
||
---|---|---|---|
Line 31: | Line 31: | ||
* //princ z Walesu// -- nic (je to titul, takže to celé může být přidáno do **SemLex**u) | * //princ z Walesu// -- nic (je to titul, takže to celé může být přidáno do **SemLex**u) | ||
* //Železná lady// -- přidat do **SemLex**u a anotovat | * //Železná lady// -- přidat do **SemLex**u a anotovat | ||
+ | * (víceslovné značky autorů pod článkem (pokud víceslovné existují) značit jako entity reprezentující jména osob) | ||
* **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | ||
Line 49: | Line 50: | ||
* //Petr Novák, ÚFAL, Malostranské náměstí 25// -- **adresa** | * //Petr Novák, ÚFAL, Malostranské náměstí 25// -- **adresa** | ||
* //Svoboda, 777 578 975// -- **adresa** | * //Svoboda, 777 578 975// -- **adresa** | ||
+ | * //jdu do galerie Václava Špály// -- **místo** | ||
+ | * //Galerie Václava Špály koupila obraz// -- **instituce**, | ||
+ | |||
* **biblio** je pouze bibliografický údaj, čili něco strukturovaného\\ jméno knihy (stejně jako jméno filmu) je jen **objekt** (zadny **biblio**)\\ Kde je hranice? //Božena Němcová, Babička, str. 143// budeme posuzovat jak? (Kol. Šidák dostal pokyn označit jako **biblio** a poznamenat na papír s připomínkami pro nás) | * **biblio** je pouze bibliografický údaj, čili něco strukturovaného\\ jméno knihy (stejně jako jméno filmu) je jen **objekt** (zadny **biblio**)\\ Kde je hranice? //Božena Němcová, Babička, str. 143// budeme posuzovat jak? (Kol. Šidák dostal pokyn označit jako **biblio** a poznamenat na papír s připomínkami pro nás) | ||
* **X** slouží primárně pro nezařaditelné entity\\ prozatím také pro označování množství, neboť to dosud (TODO) nemá vlastní značku;\\ pomocí **X** se také anotují např. šachové koncovky | * **X** slouží primárně pro nezařaditelné entity\\ prozatím také pro označování množství, neboť to dosud (TODO) nemá vlastní značku;\\ pomocí **X** se také anotují např. šachové koncovky | ||
Line 60: | Line 64: | ||
* //pět let// -- nic (kolik) | * //pět let// -- nic (kolik) | ||
* //20 hodin// -- udává-li období => nic; udává-li večerní čas => 20 by byl **čas**, ale je to jednoslovné => také nic | * //20 hodin// -- udává-li období => nic; udává-li večerní čas => 20 by byl **čas**, ale je to jednoslovné => také nic | ||
- | * //rok 1994// -- FIXME | + | * //rok 1994// -- FIXME **čas** |
* //únor 2002// -- **čas** | * //únor 2002// -- **čas** | ||
* //počátek září 1974// -- //" | * //počátek září 1974// -- //" | ||
Line 68: | Line 72: | ||
* //v 1. polovině 20. století// -- nic FIXME | * //v 1. polovině 20. století// -- nic FIXME | ||
* //léta 1980/1// -- FIXME | * //léta 1980/1// -- FIXME | ||
+ | |||
Všechna **apelativa** budeme považovat za součást entity. Hlavním důvodem je, že určují její typ. (Příklady: | Všechna **apelativa** budeme považovat za součást entity. Hlavním důvodem je, že určují její typ. (Příklady: | ||
Line 81: | Line 86: | ||
* //Petr Novák// -- FIXME | * //Petr Novák// -- FIXME | ||
* //pan Novák// -- FIXME | * //pan Novák// -- FIXME | ||
+ | * //ulice pplk. Sochora// -- FIXME jsou součástí pojmenovaných entit - ano --ps | ||
+ | * // | ||
+ | * //zákon o daních// -- celé FIXME | ||
+ | * //podle zákona 1456/18, Sb.// -- bez //" | ||
Line 94: | Line 103: | ||
Eliptické užití frazému se anotuje původním frazémem, tedy například " | Eliptické užití frazému se anotuje původním frazémem, tedy například " | ||
- | Parafráze a variace typu //" | + | Parafráze a variace typu //" |
==== K nástroji sem-ann ==== | ==== K nástroji sem-ann ==== | ||
Line 121: | Line 131: | ||
* Obecně: frazém je to, co nelze lexikálně variovat (dopravní přestupek/ | * Obecně: frazém je to, co nelze lexikálně variovat (dopravní přestupek/ | ||
- obojí je obvyklé, ale když alespoň jedno neplatí, neznamená to ještě, že o frazém v nějakém smyslu nejde. | - obojí je obvyklé, ale když alespoň jedno neplatí, neznamená to ještě, že o frazém v nějakém smyslu nejde. | ||
- | - Máme dost různých kreativních užití ("ne Rudé, ale Šedé právo"; | + | - <del>Máme dost různých kreativních užití ("ne Rudé, ale Šedé právo"; |
- // | - // | ||
- | * Apelativa jako " | + | * <del>Apelativa jako " |
- | - ano --ps | + | - <del>ano --ps</ |
- | * slovo " | + | * <del>slovo " |
- | - souhlas. --ps | + | - <del>souhlas. --ps</ |
- | * NE typu „galerie Václava Špály“: je to místo, když se tím míní místo; ale když je tam personifikace, | + | * <del>NE typu „galerie Václava Špály“: je to místo, když se tím míní místo; ale když je tam personifikace, |
- | - ano, přesně tak si to představuji. --ps | + | - <del>ano, přesně tak si to představuji. --ps</ |
- | * devět sekund, pět let, 20 hodin – jde o čas ?(shodli jsme se, že „rok 1994“ značíme celé jako čas), nebo máme postupovat analogicky podle „10 metrů“ a neanotovat? | + | * <del>devět sekund, pět let, 20 hodin – jde o čas ?</ |
- | * Problém značení variabilních frazémů (dostal x měsíců natvrdo) a nekonečně rozvinutelných frazémů (" | + | |
- // | - // | ||
- // | - // | ||
- | * (víceslovné značky autorů pod článkem (pokud víceslovné existují) značit jako entity reprezentující jména osob) | ||
* Případy jako //první vlna//, //druhá vlna// aj. kazdý značíme jako frazém, těch vln asi není až tak hodně, max. 10. | * Případy jako //první vlna//, //druhá vlna// aj. kazdý značíme jako frazém, těch vln asi není až tak hodně, max. 10. | ||
* Ve frazémech typu //přešla mne chut'// | * Ve frazémech typu //přešla mne chut'// | ||
Line 152: | Line 161: | ||
1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře | 1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře | ||
jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak? | jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak? | ||
- | 2) jak anotovat fakulty a názvy univerzit, obory apod? | + | 2) jak anotovat |
- | 3) jak znacit parafraze a nekonecne mnozstvi variaci typu " | + | 3) <del>jak znacit parafraze a nekonecne mnozstvi variaci typu " |
* Další příklad neznačitelného souboru: ln95048_045.t.gz: | * Další příklad neznačitelného souboru: ln95048_045.t.gz: |