[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Table of Contents

Chyby v PDT-VALLEXu

uzly v DPHR zapsány jako sourozenci (místo otec-syn)

padni, komu padni

padnout (v-w3356f13) padni, komu padni
DPHR(padnout,kdo.3)
ale má být
DPHR(padnout[kdo.3])
a tak tomu je také v jediném použití v datech: tamw/train-8/ln95045_067.a.gz#a-ln95045-067-p8s1w18

jít ruku v ruce

jít (v-w1339f21) jít ruku v ruce
ACT(.1) DPHR(ruka:S4,v-1[ruka:S6])
ACT(.1) DPHR(ruka:S4[v-1[ruka:S6]])
tamw/train-4/ln94203_81.a.gz#a-ln94203-81-p4s3w4 a tamw/train-6/ln94208_26.a.gz#a-ln94208-26-p3s2w4

? mít hluboko do kapsy

mít (v-w1855f46) mít hluboko do kapsy
ACT(.1) DPHR(hluboko,do-1[kapsa:S2])
ACT(.1) DPHR(hluboko[do-1[kapsa:S2]])
buď je špatně jedna ze tří anotací v datech (tamw/train-4/cmpr9413_052.a.gz#a-cmpr9413-052-p24s3w9), nebo PDT-VALLEX a zbylé dvě anotace (tamw/train-2/cmpr9415_028.a.gz#a-cmpr9415-028-p4s2w9 a tamw/train-4/cmpr9413_042.a.gz#a-cmpr9413-042-p4s2w1)

alternativní formy zapsány jako sourozenci

Po konzultaci s Petrem Pajasem se zdá, že v HTML verzi vallexu je chyba - místo středníku se generovala čárka. Pokusím se to opravit, v tredu se rámce serializují správně.
stepanek 2010/12/10 23:56

přijít na mysl

obsahuje

                <element functor="PAT" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" case="1" inherits="1" neg="unspecified"/>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="f"/>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="že" neg="unspecified">
                         <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="v"/>
                      </node>
                   </form>
                </element>

a já myslím, že by tam mělo být

                <element functor="PAT" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" case="1" inherits="1" neg="unspecified"/>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="f"/>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="že" neg="unspecified">
                         <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="v"/>
                      </node>
                   </form>
                </element>

ale nejsem si moc jist. Také mě mate, že v linearisované formě ACT(.3) DPHR(na-1[mysl:S4]) PAT(.1,.f,že[.v]) se případná oprava zřejmě nijak neprojeví. –EB

Tohle je celé nějaké podezřelé. Totéž lemma má totiž ještě rámec ACT(.1) DPHR(na-1[mysl:S4]) PAT(.3) s příkladem “taková domněnka nepřišla občanům na mysl”, kdežto ten první rámec má příklad “přijde mi na mysl tento projekt”. To by se asi mělo sloučit. — stepanek 2010/08/09 12:47

bojovat mezi-7 mezi-7

Tenhle adresát mi také přijde špatně: ADDR([…],mezi-1[.P7],mezi-1[.7],mezi-1[.7]). První formy jsem vynechal; pak tam vidím “bojovat mezi sebou”, tomu rozumím. Ale ten zbytek je nějaké duplicita. (A opět, podobně jako v předchozím případě, z této linearisované formy nejde zjistit, že zbylá dvě “mezi” jsou jediná forma o dvou totožných stromech.) — EB 2010/08/16 18:28:53

                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="mezi-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="7" inherits="1" neg="unspecified"/>
                      </node>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="mezi-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="7" inherits="1" neg="unspecified"/>
                      </node>
                   </form>

vztahovat/vztáhnout něco na něco/k něčemu

A do třetice opět chybí v XML oddělovač </form><form>:
vztáhnout ACT(:1) PAT(.4) EFF(na-1[.4],k-1[.3])
vztahovat ACT(:1) PAT(.4) EFF(na-1[.4],k-1[.3]),
ale vypadá to stejně jen kvůli “homonymii” lineárního zápisu. V XML je to odlišně (a jistě být nemá) — EB 2010/11/23 10:43:

                <element functor="EFF" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="na-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="4" inherits="1" neg="unspecified"/>
                      </node>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="k-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="3" inherits="1" neg="unspecified"/>
                      </node>
                   </form>
                </element>

a

                <element functor="EFF" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="na-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="4" inherits="1" neg="unspecified"/>
                      </node>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="k-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="3" inherits="1" neg="unspecified"/>
                      </node>
                   </form>
                </element>

spadnutí

Chybí oddělovač <form> (jde o dvě alternativní formy, ne sourozence): — OD 2011/05/30 16:23

          <element functor="ACT" type="oblig">
            <form>
              <node afun="unspecified" agreement="0" case="2" inherits="0" neg="unspecified"/>
              <node afun="unspecified" agreement="0" inherits="0" neg="unspecified" pos="u"/>
            </form>
          </element>

rozdělit

U v-w5584f2 nerozumím spojení předložkových vazeb mezi+7 a na+4 do jednoho funktoru (ADDR) – nešlo taky o dvě alternativy? — OD 2011/05/30 17:35

vztahovat

U framu v-w8695 jsou v EFF spojené předložkové vazby s na a k, dvě různé alternativy. — OD 2011/05/30 17:43

podnítit

Frame v-w3604f2 má u PAT spojené předložkové vazby s proti a aby. — OD 2011/05/31 09:53

Ostatní

=

U PAT jsou jako alternativní formy uvedeny pády 1 a 4, nemá být 1 a 3 (aby to odpovídalo čtení “x se rovná ypsilon, x se rovná ypsilonu”)? – AV 2013/05/12 12:20

chce se mi

Lemma “se” je asi zanořeno o patro níže, než by mělo být:
chtít (v-w1193f2) chce se mi pracovat
ACT(.3) PAT(.f) ---([se])
neboť jediné použití v datech (tamw/train-7/ln95049_023.a.gz#a-ln95049-023-p4s8w6) má “se” zavěšené hned pod “chtít”. — EB 2010/08/16 18:40
Je-li to chyba, tak stejné je potřeba opravit u reciprocit:

(Mmch. zde Zápis valenčních rámců a jeho sémantika jsem se o proškrtnutém funktoru nic nedočetl a ani tam není uveden jako povolená možnost (v DTD však opomenut není). — EB 2010/08/16 18:48)

platit

Není mi jasné, proč u prvního rámce (v-w3468f1) je povoleno, aby doplnění, realizované předložkovou frází za+4 bylo realizováno buď jako fakultativní EFF (uvedený v rámci) nebo jako CAUS (uvedené v několika příkladech a i v některých větách v datech). Nemělo by se to sjednotit? — AV 2013/09/05 11:34

protestovat

U PAT je jako možná forma uvedena předložková vazba s oproti, není to chyba? – OD 2011/05/30 18:02

prezentování

V lemmatu doplnění EFF je lemma=“{jako,jako6to}”, tj. s 6 místo žOD 2011/05/30 16:27

vypadat

U frame v-w8170f5a doplnění PAT je lemma=“a” místo pos=“a”OD 2011/05/30 16:24

vyplatit

Frame v-w8192f3 a jeho jediná instance v korpusu (věta t-ln95046-037-p2s5): užití sice formálně odpovídá rámci, ale naprosto neodpovídá příkladu, který je u rámce uveden (jedná se o jiný význam). — AV 2013/09/09 17:14

vyházet

Chybný pád předložky

Nekonsistence ve značkách??

být stydno/hanba/líto...

Není mi jasné, proč jsou následující příklady řešeny jako varianty lemmatu se složenými závorkami:
CPHR({stydno-1},{hanba,trapno}.S1,jeden.NS1)
CPHR({líto})
Čím by se to lišilo, kdyby to bylo zapsáno (pro mě přirozeněji) takto:
CPHR({stydno-1,hanba,trapno}.S1,jeden.NS1) (nemluvě o CPHR({stydno-1,hanba,trapno,jedno}))
CPHR(líto)
EB 2010/11/19 23:14

ustavovat/určovat jako zástupce.NOUN

Na co je zdůraznění substantiva v třetí formě Effectu u “ustavovat”? Resp. mi není jasný rozdíl mezi následujícími rámci u “ustavovat” a “určovat”:
ACT(.1) PAT(.4) EFF(.7,za-1[.4],.n4[{jako,jakožto}:/AuxY]) ustavoval ho svým zástupcem / za svého zástupce / jako svého zástupce
ACT(.1) PAT(.4) EFF(.7,za-1[.4],.4[{jako,jakožto}:/AuxY],:a4[{jako,jakožto}:/AuxY]) určoval ho svým zástupcem / za svého zástupce / jako svého zástupce
Napadá mě snad jen, že se tím míní, že nelze říci například “*ustavoval ho jako chytrého”, kdežto “?určoval ho jako chytrého” ano. Ovšem v druhém rámci je stejně adjektivum vyčleněno zvlášť, takže co zbývá? (U sloves se n vyskytuje přesně dvakrát v celém PDT-VALLEXu, v této posici jen jednou.) — EB 2010/11/22 09:40

změnit k dobrému.ADJ

Podobně jako u předchozího zdůraznění substantiva, není zde zbytečně adjektivum?
DPHR(k-1[dobrý.a3]) v “změnit vše k dobrému”; oproti
DPHR(v-1[dobrý.NS4]) v “vše se v dobré obrátilo”, či
DPHR(k-1[dobrý.N3@2]) v “situace se obracela k lepšímu”
Nemělo by tam být spíše Neutrum, jako v ostatních? — EB 2010/11/22 11:50

tlustý do tenkejch

Je to jen detail v málo používaném úsloví, ale má tam být podle mě plurál i v prvním slově:
DPHR(tlustý.IS1,do-1[tenký.IP2]) v-w1339f37 Used: 1x začaly “jít tlustý do tenkejch”
zvláště s uvedeným příkladem převzatým z dat (train-6/ln95048_067.t.gz#t-ln95048-067-p16s2w7). (Ovšem Google umí najít i “když jim teklo tlustý.IS1 do tenkých.IP2”.) — EB 2010/11/23 10:18

Nekonzistence v zavěšení uzlů funktorů

ze strany

U být (v-w243f21), slyšet, vypovězení visí z na slově strana strana a je přidaný genitiv. U slýchávat genitiv (nebo přivlastnění) vyplněné není, rámce sloves odmítnout a vznést mají slovo strana zbytečně ve složených závorkách. Varianta s přivlastněním u být (w243f21) má zavěšení opačné. — OD 2011/05/31 10:19

ve prospěch

U rámců intervenovat-V:PAT vyslovit_se-V:PAT zakročit-V:PAT zakročovat-V:PAT zasáhnout-V:PAT zasahovat-V:PAT s genitivem a intervenovat-V:PAT zakročit-V:PAT zakročovat-V:PAT zasáhnout-V:PAT zasahovat-V:PAT s přivlastněním je v zavěšené pod prospěch. U vyslovovat_se-V:PAT a hovořit-V:PAT mluvit-V:PAT svědčit-V:PAT je to naopak. — OD 2011/05/31 10:19

že

Naprostá většina rámců, které obsahují doplnění — vedlejší větu s že, má na něj pověšený uzel s pos=“v”. U slova prohlášení to chybí.

na téma

Většinou visí téma na na. U slovesa hovořit je vyplněná i možnost genitivu, přivlastnění nebo ukazovacího zájmena. U slov bavit_se, debatvoat, diskutovat, interview, jednat, mluvit, přednášet nic dalšího vyplněné není. U slova mikrointerview je na zavěšené jako sourozenec slova téma. — OD 2011/05/31 10:43

Neúplnost

nechat na holičce a na pochybě

nechat někoho DPHR(na-1[holička.6]) nebo DPHR(na-1[pochyba.6]) by asi mělo mít uvedeno, že lze použít výhradně v plurálu. Ale jsem na pochybě, nemá-li to jiný důvod. — EB 2010/11/22 20:38

chyby ve webovém rozhraní PDT-VALLEXu

Webové rozhraní: http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/vallex.html

  1. http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/S_vallex.html#stát s – překlep v lemmatu, nedokončené příklady… nějaký zbytek
  2. http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/B_vallex.html#být – v-w243f46 být k nezaplacení by možná měl mít značku '~' pro negaci

[ Back to the navigation ] [ Back to the content ]