Table of Contents
Chyby v PDT-VALLEXu
uzly v DPHR zapsány jako sourozenci (místo otec-syn)
padni, komu padni
padnout (v-w3356f13) padni, komu padni
DPHR(padnout,kdo.3)
ale má být
DPHR(padnout[kdo.3])
a tak tomu je také v jediném použití v datech: tamw/train-8/ln95045_067.a.gz#a-ln95045-067-p8s1w18
jít ruku v ruce
jít (v-w1339f21) jít ruku v ruce
ACT(.1) DPHR(ruka:S4,v-1[ruka:S6])
⇒
ACT(.1) DPHR(ruka:S4[v-1[ruka:S6]])
tamw/train-4/ln94203_81.a.gz#a-ln94203-81-p4s3w4
a tamw/train-6/ln94208_26.a.gz#a-ln94208-26-p3s2w4
? mít hluboko do kapsy
mít (v-w1855f46) mít hluboko do kapsy
ACT(.1) DPHR(hluboko,do-1[kapsa:S2])
⇒
ACT(.1) DPHR(hluboko[do-1[kapsa:S2]])
buď je špatně jedna ze tří anotací v datech (tamw/train-4/cmpr9413_052.a.gz#a-cmpr9413-052-p24s3w9
), nebo PDT-VALLEX a zbylé dvě anotace (tamw/train-2/cmpr9415_028.a.gz#a-cmpr9415-028-p4s2w9
a tamw/train-4/cmpr9413_042.a.gz#a-cmpr9413-042-p4s2w1
)
alternativní formy zapsány jako sourozenci
Po konzultaci s Petrem Pajasem se zdá, že v HTML verzi vallexu je chyba - místo středníku se generovala čárka. Pokusím se to opravit, v tredu se rámce serializují správně.
— stepanek 2010/12/10 23:56
přijít na mysl
obsahuje
<element functor="PAT" type="oblig"> <form> <node afun="unspecified" agreement="0" case="1" inherits="1" neg="unspecified"/> </form> <form> <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="f"/> <node afun="unspecified" agreement="0" inherits="0" lemma="že" neg="unspecified"> <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="v"/> </node> </form> </element>
a já myslím, že by tam mělo být
<element functor="PAT" type="oblig"> <form> <node afun="unspecified" agreement="0" case="1" inherits="1" neg="unspecified"/> </form> <form> <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="f"/> </form> <form> <node afun="unspecified" agreement="0" inherits="0" lemma="že" neg="unspecified"> <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="v"/> </node> </form> </element>
ale nejsem si moc jist. Také mě mate, že v linearisované formě ACT(.3) DPHR(na-1[mysl:S4]) PAT(.1,.f,že[.v])
se případná oprava zřejmě nijak neprojeví. –EB
Tohle je celé nějaké podezřelé. Totéž lemma má totiž ještě rámec ACT(.1) DPHR(na-1[mysl:S4]) PAT(.3)
s příkladem “taková domněnka nepřišla občanům na mysl”, kdežto ten první rámec má příklad “přijde mi na mysl tento projekt”. To by se asi mělo sloučit. — stepanek 2010/08/09 12:47
bojovat mezi-7 mezi-7
Tenhle adresát mi také přijde špatně: ADDR([…],mezi-1[.P7],mezi-1[.7],mezi-1[.7])
. První formy jsem vynechal; pak tam vidím “bojovat mezi sebou”, tomu rozumím. Ale ten zbytek je nějaké duplicita. (A opět, podobně jako v předchozím případě, z této linearisované formy nejde zjistit, že zbylá dvě “mezi” jsou jediná forma o dvou totožných stromech.) — EB 2010/08/16 18:28:53
<form> <node afun="unspecified" agreement="0" inherits="0" lemma="mezi-1" neg="unspecified"> <node afun="unspecified" agreement="0" case="7" inherits="1" neg="unspecified"/> </node> <node afun="unspecified" agreement="0" inherits="0" lemma="mezi-1" neg="unspecified"> <node afun="unspecified" agreement="0" case="7" inherits="1" neg="unspecified"/> </node> </form>
vztahovat/vztáhnout něco na něco/k něčemu
A do třetice opět chybí v XML oddělovač </form><form>
:
vztáhnout ACT(:1) PAT(.4) EFF(na-1[.4],k-1[.3])
vztahovat ACT(:1) PAT(.4) EFF(na-1[.4],k-1[.3])
,
ale vypadá to stejně jen kvůli “homonymii” lineárního zápisu. V XML je to odlišně (a jistě být nemá) — EB 2010/11/23 10:43:
<element functor="EFF" type="oblig"> <form> <node afun="unspecified" agreement="0" inherits="0" lemma="na-1" neg="unspecified"> <node afun="unspecified" agreement="0" case="4" inherits="1" neg="unspecified"/> </node> </form> <form> <node afun="unspecified" agreement="0" inherits="0" lemma="k-1" neg="unspecified"> <node afun="unspecified" agreement="0" case="3" inherits="1" neg="unspecified"/> </node> </form> </element>
a
<element functor="EFF" type="oblig"> <form> <node afun="unspecified" agreement="0" inherits="0" lemma="na-1" neg="unspecified"> <node afun="unspecified" agreement="0" case="4" inherits="1" neg="unspecified"/> </node> <node afun="unspecified" agreement="0" inherits="0" lemma="k-1" neg="unspecified"> <node afun="unspecified" agreement="0" case="3" inherits="1" neg="unspecified"/> </node> </form> </element>
spadnutí
Chybí oddělovač <form>
(jde o dvě alternativní formy, ne sourozence): — OD 2011/05/30 16:23
<element functor="ACT" type="oblig"> <form> <node afun="unspecified" agreement="0" case="2" inherits="0" neg="unspecified"/> <node afun="unspecified" agreement="0" inherits="0" neg="unspecified" pos="u"/> </form> </element>
rozdělit
U v-w5584f2
nerozumím spojení předložkových vazeb mezi+7
a na+4
do jednoho funktoru (ADDR
) – nešlo taky o dvě alternativy? — OD 2011/05/30 17:35
vztahovat
U framu v-w8695
jsou v EFF
spojené předložkové vazby s na
a k
, dvě různé alternativy. — OD 2011/05/30 17:43
podnítit
Frame v-w3604f2
má u PAT
spojené předložkové vazby s proti
a aby
. — OD 2011/05/31 09:53
Ostatní
=
U PAT jsou jako alternativní formy uvedeny pády 1 a 4, nemá být 1 a 3 (aby to odpovídalo čtení “x se rovná ypsilon, x se rovná ypsilonu”)? – AV 2013/05/12 12:20
chce se mi
Lemma “se” je asi zanořeno o patro níže, než by mělo být:
chtít (v-w1193f2) chce se mi pracovat
ACT(.3) PAT(.f) ---([se])
neboť jediné použití v datech (tamw/train-7/ln95049_023.a.gz#a-ln95049-023-p4s8w6
) má “se” zavěšené hned pod “chtít”. — EB 2010/08/16 18:40
Je-li to chyba, tak stejné je potřeba opravit u reciprocit:
- líbat (0 výskytů)
- najít (0 výskytů)
- potkávat (0 výskytů)
- poznat (0 výskytů)
- střetávat (0 výskytů)
- uvítat (0 výskytů)
- vidět (1 výskyt, “se” visí pod “vidět”)
- vítat (0 výskytů)
- znát (7 výskytů)
(Mmch. zde Zápis valenčních rámců a jeho sémantika jsem se o proškrtnutém funktoru nic nedočetl a ani tam není uveden jako povolená možnost (v DTD však opomenut není). — EB 2010/08/16 18:48)
platit
Není mi jasné, proč u prvního rámce (v-w3468f1) je povoleno, aby doplnění, realizované předložkovou frází za+4 bylo realizováno buď jako fakultativní EFF (uvedený v rámci) nebo jako CAUS (uvedené v několika příkladech a i v některých větách v datech). Nemělo by se to sjednotit? — AV 2013/09/05 11:34
protestovat
U PAT
je jako možná forma uvedena předložková vazba s oproti
, není to chyba? – OD 2011/05/30 18:02
prezentování
V lemmatu doplnění EFF
je lemma=“{jako,jako6to}”
, tj. s 6
místo ž
– OD 2011/05/30 16:27
vypadat
U frame v-w8170f5
a doplnění PAT
je lemma=“a”
místo pos=“a”
— OD 2011/05/30 16:24
vyplatit
Frame v-w8192f3
a jeho jediná instance v korpusu (věta t-ln95046-037-p2s5
): užití sice formálně odpovídá rámci, ale naprosto neodpovídá příkladu, který je u rámce uveden (jedná se o jiný význam). — AV 2013/09/09 17:14
vyházet
Chybný pád předložky
bránící (v-w197f1)
– uPAT
jev
se 7. pádemhájení (v-w1016f1)
– uEFF
jeproti
se 6. pádemkonzultace (v-w1539f1)
– uPAT
jeo
se 7. pádemproměnit (v-w4426f2)
– uEFF
jedo
se 4. pádemproměňovat (v-w4428f2)
– uEFF
jedo
se 4. pádempropojit (v-w4493f3)
– uEFF
jedo
se 4. pádemrůst (v-w5842)
– uPAT
jena
se 2. pádemstanovený (v-w6477f3)
– uEFF
jena
se 2. pádemvyházet (v-w7879f1)
– uPAT
jeza
se 2. pádemzměkčit (v-w9611f1)
– uEFF
jedo
se 4. pádemzměkčovat (v-w9615)
– uEFF
jedo
se 4. pádem
Nekonsistence ve značkách??
být stydno/hanba/líto...
Není mi jasné, proč jsou následující příklady řešeny jako varianty lemmatu se složenými závorkami:
CPHR({stydno-1},{hanba,trapno}.S1,jeden.NS1)
CPHR({líto})
Čím by se to lišilo, kdyby to bylo zapsáno (pro mě přirozeněji) takto:
CPHR({stydno-1,hanba,trapno}.S1,jeden.NS1)
(nemluvě o CPHR({stydno-1,hanba,trapno,jedno})
)
CPHR(líto)
— EB 2010/11/19 23:14
ustavovat/určovat jako zástupce.NOUN
Na co je zdůraznění substantiva v třetí formě Effectu u “ustavovat”? Resp. mi není jasný rozdíl mezi následujícími rámci u “ustavovat” a “určovat”:
ACT(.1) PAT(.4) EFF(.7,za-1[.4],.n4[{jako,jakožto}:/AuxY])
ustavoval ho svým zástupcem / za svého zástupce / jako svého zástupce
ACT(.1) PAT(.4) EFF(.7,za-1[.4],.4[{jako,jakožto}:/AuxY],:a4[{jako,jakožto}:/AuxY])
určoval ho svým zástupcem / za svého zástupce / jako svého zástupce
Napadá mě snad jen, že se tím míní, že nelze říci například “*ustavoval ho jako chytrého”, kdežto “?určoval ho jako chytrého” ano. Ovšem v druhém rámci je stejně adjektivum vyčleněno zvlášť, takže co zbývá? (U sloves se n vyskytuje přesně dvakrát v celém PDT-VALLEXu, v této posici jen jednou.) — EB 2010/11/22 09:40
změnit k dobrému.ADJ
Podobně jako u předchozího zdůraznění substantiva, není zde zbytečně adjektivum?
DPHR(k-1[dobrý.a3])
v “změnit vše k dobrému”; oproti
DPHR(v-1[dobrý.NS4])
v “vše se v dobré obrátilo”, či
DPHR(k-1[dobrý.N3@2])
v “situace se obracela k lepšímu”
Nemělo by tam být spíše Neutrum, jako v ostatních? — EB 2010/11/22 11:50
tlustý do tenkejch
Je to jen detail v málo používaném úsloví, ale má tam být podle mě plurál i v prvním slově:
DPHR(tlustý.IS1,do-1[tenký.IP2])
v-w1339f37 Used: 1x začaly “jít tlustý do tenkejch”
zvláště s uvedeným příkladem převzatým z dat (train-6/ln95048_067.t.gz#t-ln95048-067-p16s2w7). (Ovšem Google umí najít i “když jim teklo tlustý.IS1 do tenkých.IP2”.) — EB 2010/11/23 10:18
Nekonzistence v zavěšení uzlů funktorů
ze strany
U být (v-w243f21), slyšet, vypovězení visí z na slově strana strana a je přidaný genitiv. U slýchávat genitiv (nebo přivlastnění) vyplněné není, rámce sloves odmítnout a vznést mají slovo strana zbytečně ve složených závorkách. Varianta s přivlastněním u být (w243f21) má zavěšení opačné. — OD 2011/05/31 10:19
ve prospěch
U rámců intervenovat-V:PAT vyslovit_se-V:PAT zakročit-V:PAT zakročovat-V:PAT zasáhnout-V:PAT zasahovat-V:PAT s genitivem a intervenovat-V:PAT zakročit-V:PAT zakročovat-V:PAT zasáhnout-V:PAT zasahovat-V:PAT s přivlastněním je v zavěšené pod prospěch. U vyslovovat_se-V:PAT a hovořit-V:PAT mluvit-V:PAT svědčit-V:PAT je to naopak. — OD 2011/05/31 10:19
že
Naprostá většina rámců, které obsahují doplnění — vedlejší větu s že, má na něj pověšený uzel s pos=“v”. U slova prohlášení to chybí.
na téma
Většinou visí téma na na. U slovesa hovořit je vyplněná i možnost genitivu, přivlastnění nebo ukazovacího zájmena. U slov bavit_se, debatvoat, diskutovat, interview, jednat, mluvit, přednášet nic dalšího vyplněné není. U slova mikrointerview je na zavěšené jako sourozenec slova téma. — OD 2011/05/31 10:43
Neúplnost
nechat na holičce a na pochybě
nechat někoho DPHR(na-1[holička.6])
nebo DPHR(na-1[pochyba.6])
by asi mělo mít uvedeno, že lze použít výhradně v plurálu. Ale jsem na pochybě, nemá-li to jiný důvod. — EB 2010/11/22 20:38
chyby ve webovém rozhraní PDT-VALLEXu
Webové rozhraní: http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/vallex.html
- http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/S_vallex.html#stát s – překlep v lemmatu, nedokončené příklady… nějaký zbytek
- http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/B_vallex.html#být – v-w243f46 být k nezaplacení by možná měl mít značku '~' pro negaci