Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
external:lexemann:guidelines [2007/03/14 10:22] stranak |
external:lexemann:guidelines [2009/03/25 17:44] bejcek Doplnění adres, čísel a časů; nepojmenované entity |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Anotační instrukce ====== | ====== Anotační instrukce ====== | ||
+ | ===== Pravidla ===== | ||
- | ==== Pravidla ==== | + | ==== SemLex -- slovník víceslovných lexémů |
- | + | ||
- | == SemLex -- slovník víceslovných lexémů == | + | |
* Vyhledávání | * Vyhledávání | ||
* Přidávání do slovníku | * Přidávání do slovníku | ||
Line 10: | Line 9: | ||
* je vhodné časté pojmenované entity také přidávat do slovníku, v další verzi programu to poslouží k automatické předanotaci | * je vhodné časté pojmenované entity také přidávat do slovníku, v další verzi programu to poslouží k automatické předanotaci | ||
* Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | * Pro odlišení pojmenovaných entit od ostatních lexémů ve slovníku je potřeba určit typ entity do glosy:\\ '' | ||
+ | * Pokud přidáváte položku zřetelně odvozenou od jiné, která už ve slovníku je, poznamenejte to opět do glosy jako '' | ||
+ | * Pro frazémy neurčitého slovního druhu (jako např. " | ||
+ | * Je-li potřeba položku smazat, použijte '' | ||
- | == Pojmenované entity == | + | |
- | | + | |
- | --- | + | |
- | * TODO Sjednotit | + | ==== Pojmenované entity |
+ | **v této fázi se zabýváme jen striktně víceslovnými NE:** tedy těmi, uvnitř nichž nemá smysl ani závislostní popis, ani funktory. Jednoslovné NE se budou anotovat až v 2. fázi v TrEdu. | ||
+ | |||
+ | Vnitřní struktura nás (prozatím) nezajímá, takže například " | ||
+ | |||
+ | < | ||
+ | |||
+ | ---- | ||
* **jméno** jsou jména pouze osob a zvířat\\ ke jménu osoby patří i tituly | * **jméno** jsou jména pouze osob a zvířat\\ ke jménu osoby patří i tituly | ||
* v případech jako " | * v případech jako " | ||
+ | * //profesor P. Novák// -- **jméno** je //P. Novák// | ||
+ | * //prof. Novák// -- **jméno** | ||
+ | * //princ z Walesu// -- nic (je to titul, takže to celé může být přidáno do **SemLex**u) | ||
+ | * //Železná lady// -- přidat do **SemLex**u a anotovat | ||
+ | * (víceslovné značky autorů pod článkem (pokud víceslovné existují) značit jako entity reprezentující jména osob) | ||
* **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | * **objekt** jsou __pojmenované__ věci, které nejsou lidi, zvířata, instituce a místní názvy\\ viz zmínku u **biblio**. | ||
Line 36: | Line 50: | ||
* //Petr Novák, ÚFAL, Malostranské náměstí 25// -- **adresa** | * //Petr Novák, ÚFAL, Malostranské náměstí 25// -- **adresa** | ||
* //Svoboda, 777 578 975// -- **adresa** | * //Svoboda, 777 578 975// -- **adresa** | ||
+ | * //kontakt: 777 578 975// -- v tomto případě je to celé **adresa**, neboť " | ||
+ | * //kontakt: 777 578 975, e-mail pepa@ufal.cz, | ||
+ | * //č.ú.: 4328-483859392054/ | ||
+ | * //jdu do galerie Václava Špály// -- **místo** | ||
+ | * //Galerie Václava Špály koupila obraz// -- **instituce**, | ||
+ | |||
* **biblio** je pouze bibliografický údaj, čili něco strukturovaného\\ jméno knihy (stejně jako jméno filmu) je jen **objekt** (zadny **biblio**)\\ Kde je hranice? //Božena Němcová, Babička, str. 143// budeme posuzovat jak? (Kol. Šidák dostal pokyn označit jako **biblio** a poznamenat na papír s připomínkami pro nás) | * **biblio** je pouze bibliografický údaj, čili něco strukturovaného\\ jméno knihy (stejně jako jméno filmu) je jen **objekt** (zadny **biblio**)\\ Kde je hranice? //Božena Němcová, Babička, str. 143// budeme posuzovat jak? (Kol. Šidák dostal pokyn označit jako **biblio** a poznamenat na papír s připomínkami pro nás) | ||
- | * **X** slouží primárně pro nezařaditelné entity\\ prozatím také pro označování množství, neboť to dosud (TODO) nemá vlastní značku | + | * **X** slouží primárně pro nezařaditelné entity\\ prozatím také pro označování množství, neboť to dosud (TODO) nemá vlastní značku;\\ pomocí **X** se také anotují např. šachové koncovky |
* //100 -- 200 metrů čtverečních// | * //100 -- 200 metrů čtverečních// | ||
* //10 m// -- nic nic | * //10 m// -- nic nic | ||
* //od 10 do 18 let// -- **X** je "//od 10 do 18//", "// | * //od 10 do 18 let// -- **X** je "//od 10 do 18//", "// | ||
* //mezi sedadly 30 a 40// -- **X** je "// | * //mezi sedadly 30 a 40// -- **X** je "// | ||
+ | * //1. c7 Vd6+ 2. Kb5 Vd5+ 3. Kb4 Vd4+ 4. Kb3 Vd3+ 5. Kc2! Vd4! 6. c8V! Va4 7. Kb3// -- celé jako **X** jakožto šachová koncovka | ||
+ | * //pět milionů// -- **X** | ||
+ | * //3%//, //3-7%// -- obojí **X** | ||
+ | * **čas** anotujeme pouze v případě odpovědi na otázku " | ||
+ | * //devět sekund// -- nic (kolik) | ||
+ | * //pět let// -- nic (kolik) | ||
+ | * //20 hodin// -- udává-li období => nic; udává-li večerní čas => 20 by byl **čas**, ale je to jednoslovné => také nic | ||
+ | * //rok 1994// -- nic | ||
+ | * //únor 2002// -- **čas** | ||
+ | * //počátek září 1974// -- //" | ||
+ | * //60. léta// -- v zásadě ano, ale 60 je jednoslovné => nic | ||
+ | * //20. století// -- v zásadě ano, ale 20 je jednoslovné => nic | ||
+ | * //20 hodin 15 minut// -- celé **čas** | ||
+ | * //v 1. polovině 20. století// -- nic FIXME | ||
+ | * //léta 1980/1// -- FIXME | ||
+ | * //8:20// -- je representováno třemi t-uzly, takže anotovat, **čas** | ||
- | ==== K nástroji sem-ann ==== | + | Některá **apelativa** budeme považovat za součást entity, většinu však ne. |
+ | Apelativa, která budeme anotovat spolu s entitou, jsou vesměs geografické výrazy, vždy tvoří součást názvu (vynechání lze pak považovat spíše za elipsu), určují typ entity. | ||
+ | Příklady: "ulice Politických vězňů", | ||
+ | naopak neanotujeme apelativa "kniha Babička", | ||
+ | * // | ||
+ | * // | ||
+ | * // | ||
+ | * //České Budějovice, | ||
+ | * // | ||
+ | * // | ||
+ | * //kapela Doors// -- nic (anotovalo by se jen jednoslovné // | ||
+ | * //turnaj U.S. Open// -- jen U.S. Open jako objekt | ||
+ | * //chrám sv. Václava// -- celé | ||
+ | * //pan Novák// -- nic | ||
+ | * //ulice pplk. Sochora// -- celé | ||
+ | * // | ||
+ | * //zákon o daních// -- celé (pokud je to název jednoho konkrétního zákona) | ||
+ | * //podle zákona 1456/18, Sb.// -- bez //" | ||
- | * Zobrazuje-li se vlevo pod oknem s textem hvězdička (v samostatném rámečku), značí to, že soubor byl změněn a nebyl dosud uložen. | + | Pojmenovanou entitou **není** nic z následujících: |
- | * Program lze spouštět také například takto: '' | + | * //americká centrální banka// -- je to sice označení jedné konkrétní banky, ale ne její název (stejně jako // |
+ | * //vládní návrh zákona o státní sociální podpoře// -- pokud to nebude název jednoho konkrétního zákona (pak by to mělo být s velkým ' | ||
+ | |||
+ | ==== Frazémy ==== | ||
+ | |||
+ | Příklady toho, co už není frazém: | ||
+ | * moskevský čas | ||
+ | * antisemitská politika, rasistická politika | ||
+ | |||
+ | Příklady nekomposicionálních frazémů: | ||
+ | * vládní návrh | ||
+ | |||
+ | Eliptické užití frazému se anotuje původním frazémem, tedy například " | ||
+ | |||
+ | Parafráze a variace typu //" | ||
+ | |||
+ | |||
+ | ===== K nástroji sem-ann ===== | ||
+ | |||
+ | * Zobrazuje-li se vlevo pod oknem s textem hvězdička (v samostatném rámečku), značí to, že soubor byl změněn a nebyl dosud uložen. | ||
+ | * Program lze spouštět také například takto: '' | ||
=== Některé užitečné klávesy === | === Některé užitečné klávesy === | ||
Line 57: | Line 130: | ||
|F8|Next file|//od revize 94//| | |F8|Next file|//od revize 94//| | ||
- | ==== Dotazy, nejasnosti ==== | + | |
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Dotazy, nejasnosti ==== | ||
+ | Máme několik dalších nejasností, | ||
+ | |||
+ | * Obecně: frazém je to, co nelze lexikálně variovat (dopravní přestupek/ | ||
+ | - obojí je obvyklé, ale když alespoň jedno neplatí, neznamená to ještě, že o frazém v nějakém smyslu nejde. | ||
+ | - < | ||
+ | - // | ||
+ | * < | ||
+ | - < | ||
+ | * < | ||
+ | - < | ||
+ | * < | ||
+ | - < | ||
+ | * < | ||
+ | * Problém značení variabilních frazémů (dostal x měsíců natvrdo) a nekonečně rozvinutelných frazémů (" | ||
+ | - // | ||
+ | - // | ||
+ | |||
+ | * Případy jako //první vlna//, //druhá vlna// aj. kazdý značíme jako frazém, těch vln asi není až tak hodně, max. 10. | ||
+ | * Ve frazémech typu //přešla mne chut'// | ||
+ | |||
+ | |||
+ | ==PŠ+PV== | ||
+ | |||
+ | Další otázky: | ||
+ | 1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře | ||
+ | jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak? | ||
+ | 2) jak anotovat < | ||
+ | 3) < | ||
+ | |||
+ | [[oldlines|Starší pravidla]] (používaná do 23. 7. 2008). |