[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Anotační instrukce

Pravidla

SemLex -- slovník víceslovných lexémů

Pojmenované entity ("NE")

v této fázi se zabýváme jen striktně víceslovnými NE: tedy těmi, uvnitř nichž nemá smysl ani závislostní popis, ani funktory. Jednoslovné NE se budou anotovat až v 2. fázi v TrEdu. Z toho důvodu neanotujeme ani jednoslovné zkratky víceslovných NE (např. ČSSD). (Pozor, KDU-ČSL má tři tektogramatické uzly, proto je (a všechny ostatní zkratky s pomlčkou, spojovníkem, či mezerou (“MFF UK”)) chceme anotovat již v této fázi jako instituce).

Vnitřní struktura nás (prozatím) nezajímá, takže například “Astronomický ústav Univerzity Karlovy v Praze” anotujeme jako jednu jedinou instituci.

V současné podobě jsou instrukce (zejména v oblasti apelativ) někdy až protichůdné. Neznajíce dobré řešení, zveřejňujeme je alespoň tak a řešení zkusíme zkonsultovat s prací O. Krůzy.


Všechna apelativa budeme považovat za součást entity. Hlavním důvodem je, že určují její typ. (Příklady: “ulice Politických vězňů”, “náměstí Míru”, “Staroměstské náměstí”, “chrám sv. Víta”, “kniha Babička”.)
* Univerzita Karlova v Praze – anotovat celé
* Washington, DC – celé
* Washington, USA – celé
* České Budějovice, Česká republika – celé
* Matematicko-fyzikální fakulta, Univerzita Karlova v Praze – celé
* Filozofická fakulta v Českých Budějovicích – zvlášť fakultu, zvlášť město
* kapela Doors – nic (anotovalo by se jen jednoslovné Doors)
* turnaj U.S. OpenFIXME
*
*
*

Frazémy

Příklady toho, co už není frazém:

Eliptické užití frazému se anotuje původním frazémem, tedy například “zrakově postižený” je anotováno slovníkovou položkou “zrakově postižený člověk”.

K nástroji sem-ann

Některé užitečné klávesy

Ctrl-uUndou jako undo
Ctrl-yRedoy je vedle u
F5Refresh textu a přebarvenídle browserů
F7Previous fileod revize 94
F8Next fileod revize 94

Dotazy, nejasnosti

Máme několik dalších nejasností, zatím jsme se shodli na následujících řešeních:

PŠ+PV

Ještě technický problém: občas některé lexémy naprosto nevysvětlitelně nelze označit a program hlásí, že “vybraný text nemá smysl anotovat”(přitom to jsou ale výrazy, které prokazatelně smysl anotovat má), několikrát se to stalo i u celého souboru. (PŠ+PV)

  1. potřebujeme přesný údaj, kde se to stalo. Jinak chybu nemůžeme opravit. (–ps)

14/50; 14/72; 15/22, 23 (skoro celé nelze anotovat); 16/51; 16/74; 16/134 (pv)

Další otázky:
1) jak znacit vyrazy jako: vládní návrh zákona o sociální podpoře
jmena zakonu obecne znacim jako objekty, ale tady se zaroven krizi: vladni navrh, navrh zakona, zakon o socialni podpore a socialni podpora - je v takovych pripadech lepsi zadat cele heslo do slovniku s tim, ze bude slovnik velmi rychle narustat, nebo vyraz rozkouskovat a v tom pripade jak?
2) jak anotovat fakulty a názvy univerzit, obory apod?
3) jak znacit parafraze a nekonecne mnozstvi variaci typu “Zloději nechodí po horách, ale po domácnostech” (pv)

* Další příklad neznačitelného souboru: ln95048_045.t.gz: lze značit jen 1/2 jména Truman Capote. (PŠ)

1)
tyto sem sice věcně spadají, ale jelikož jde o skupinu relativně omezenou, zavádějte je jako víceslovné lexémy do slovníku!
2)
viz pozn. 1

[ Back to the navigation ] [ Back to the content ]