[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Chyby v PDT-VALLEXu

uzly v DPHR zapsány jako sourozenci (místo otec-syn)

padni, komu padni

padnout (v-w3356f13) padni, komu padni
DPHR(padnout,kdo.3)
ale má být
DPHR(padnout[kdo.3])
a tak tomu je také v jediném použití v datech: tamw/train-8/ln95045_067.a.gz#a-ln95045-067-p8s1w18

jít ruku v ruce

jít (v-w1339f21) jít ruku v ruce
ACT(.1) DPHR(ruka:S4,v-1[ruka:S6])
ACT(.1) DPHR(ruka:S4[v-1[ruka:S6]])
tamw/train-4/ln94203_81.a.gz#a-ln94203-81-p4s3w4 a tamw/train-6/ln94208_26.a.gz#a-ln94208-26-p3s2w4

? mít hluboko do kapsy

mít (v-w1855f46) mít hluboko do kapsy
ACT(.1) DPHR(hluboko,do-1[kapsa:S2])
ACT(.1) DPHR(hluboko[do-1[kapsa:S2]])
buď je špatně jedna ze tří anotací v datech (tamw/train-4/cmpr9413_052.a.gz#a-cmpr9413-052-p24s3w9), nebo PDT-VALLEX a zbylé dvě anotace (tamw/train-2/cmpr9415_028.a.gz#a-cmpr9415-028-p4s2w9 a tamw/train-4/cmpr9413_042.a.gz#a-cmpr9413-042-p4s2w1)

alternativní formy zapsány jako sourozenci

Po konzultaci s Petrem Pajasem se zdá, že v HTML verzi vallexu je chyba - místo středníku se generovala čárka. Pokusím se to opravit, v tredu se rámce serializují správně.
stepanek 2010/12/10 23:56

přijít na mysl

obsahuje

                <element functor="PAT" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" case="1" inherits="1" neg="unspecified"/>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="f"/>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="že" neg="unspecified">
                         <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="v"/>
                      </node>
                   </form>
                </element>

a já myslím, že by tam mělo být

                <element functor="PAT" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" case="1" inherits="1" neg="unspecified"/>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="f"/>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="že" neg="unspecified">
                         <node afun="unspecified" agreement="0" inherits="1" neg="unspecified" pos="v"/>
                      </node>
                   </form>
                </element>

ale nejsem si moc jist. Také mě mate, že v linearisované formě ACT(.3) DPHR(na-1[mysl:S4]) PAT(.1,.f,že[.v]) se případná oprava zřejmě nijak neprojeví. –EB

Tohle je celé nějaké podezřelé. Totéž lemma má totiž ještě rámec ACT(.1) DPHR(na-1[mysl:S4]) PAT(.3) s příkladem “taková domněnka nepřišla občanům na mysl”, kdežto ten první rámec má příklad “přijde mi na mysl tento projekt”. To by se asi mělo sloučit. — stepanek 2010/08/09 12:47

bojovat mezi-7 mezi-7

Tenhle adresát mi také přijde špatně: ADDR([…],mezi-1[.P7],mezi-1[.7],mezi-1[.7]). První formy jsem vynechal; pak tam vidím “bojovat mezi sebou”, tomu rozumím. Ale ten zbytek je nějaké duplicita. (A opět, podobně jako v předchozím případě, z této linearisované formy nejde zjistit, že zbylá dvě “mezi” jsou jediná forma o dvou totožných stromech.) — EB 2010/08/16 18:28:53

                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="mezi-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="7" inherits="1" neg="unspecified"/>
                      </node>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="mezi-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="7" inherits="1" neg="unspecified"/>
                      </node>
                   </form>

vztahovat/vztáhnout něco na něco/k něčemu

A do třetice opět chybí v XML oddělovač </form><form>:
vztáhnout ACT(:1) PAT(.4) EFF(na-1[.4],k-1[.3])
vztahovat ACT(:1) PAT(.4) EFF(na-1[.4],k-1[.3]),
ale vypadá to stejně jen kvůli “homonymii” lineárního zápisu. V XML je to odlišně (a jistě být nemá) — EB 2010/11/23 10:43:

                <element functor="EFF" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="na-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="4" inherits="1" neg="unspecified"/>
                      </node>
                   </form>
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="k-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="3" inherits="1" neg="unspecified"/>
                      </node>
                   </form>
                </element>

a

                <element functor="EFF" type="oblig">
                   <form>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="na-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="4" inherits="1" neg="unspecified"/>
                      </node>
                      <node afun="unspecified" agreement="0" inherits="0" lemma="k-1" neg="unspecified">
                         <node afun="unspecified" agreement="0" case="3" inherits="1" neg="unspecified"/>
                      </node>
                   </form>
                </element>

Ostatní

chce se mi

Lemma “se” je asi zanořeno o patro níže, než by mělo být:
chtít (v-w1193f2) chce se mi pracovat
ACT(.3) PAT(.f) ---([se])
neboť jediné použití v datech (tamw/train-7/ln95049_023.a.gz#a-ln95049-023-p4s8w6) má “se” zavěšené hned pod “chtít”. — EB 2010/08/16 18:40
Je-li to chyba, tak stejné je potřeba opravit u reciprocit:

(Mmch. zde Zápis valenčních rámců a jeho sémantika jsem se o proškrtnutém funktoru nic nedočetl a ani tam není uveden jako povolená možnost (v DTD však opomenut není). — EB 2010/08/16 18:48)

Nekonsistence ve značkách??

být stydno/hanba/líto...

Není mi jasné, proč jsou následující příklady řešeny jako varianty lemmatu se složenými závorkami:
CPHR({stydno-1},{hanba,trapno}.S1,jeden.NS1)
CPHR({líto})
Čím by se to lišilo, kdyby to bylo zapsáno (pro mě přirozeněji) takto:
CPHR({stydno-1,hanba,trapno}.S1,jeden.NS1) (nemluvě o CPHR({stydno-1,hanba,trapno,jedno}))
CPHR(líto)
EB 2010/11/19 23:14

ustavovat/určovat jako zástupce.NOUN

Na co je zdůraznění substantiva v třetí formě Effectu u “ustavovat”? Resp. mi není jasný rozdíl mezi následujícími rámci u “ustavovat” a “určovat”:
ACT(.1) PAT(.4) EFF(.7,za-1[.4],.n4[{jako,jakožto}:/AuxY]) ustavoval ho svým zástupcem / za svého zástupce / jako svého zástupce
ACT(.1) PAT(.4) EFF(.7,za-1[.4],.4[{jako,jakožto}:/AuxY],:a4[{jako,jakožto}:/AuxY]) určoval ho svým zástupcem / za svého zástupce / jako svého zástupce
Napadá mě snad jen, že se tím míní, že nelze říci například “*ustavoval ho jako chytrého”, kdežto “?určoval ho jako chytrého” ano. Ovšem v druhém rámci je stejně adjektivum vyčleněno zvlášť, takže co zbývá? (U sloves se n vyskytuje přesně dvakrát v celém PDT-VALLEXu, v této posici jen jednou.) — EB 2010/11/22 09:40

změnit k dobrému.ADJ

Podobně jako u předchozího zdůraznění substantiva, není zde zbytečně adjektivum?
DPHR(k-1[dobrý.a3]) v “změnit vše k dobrému”; oproti
DPHR(v-1[dobrý.NS4]) v “vše se v dobré obrátilo”, či
DPHR(k-1[dobrý.N3@2]) v “situace se obracela k lepšímu”
Nemělo by tam být spíše Neutrum, jako v ostatních? — EB 2010/11/22 11:50

tlustý do tenkejch

Je to jen detail v málo používaném úsloví, ale má tam být podle mě plurál i v prvním slově:
DPHR(tlustý.IS1,do-1[tenký.IP2]) v-w1339f37 Used: 1x začaly “jít tlustý do tenkejch”
zvláště s uvedeným příkladem převzatým z dat (train-6/ln95048_067.t.gz#t-ln95048-067-p16s2w7). (Ovšem Google umí najít i “když jim teklo tlustý.IS1 do tenkých.IP2”.) — EB 2010/11/23 10:18

Neúplnost

nechat na holičce a na pochybě

nechat někoho DPHR(na-1[holička.6]) nebo DPHR(na-1[pochyba.6]) by asi mělo mít uvedeno, že lze použít výhradně v plurálu. Ale jsem na pochybě, nemá-li to jiný důvod. — EB 2010/11/22 20:38

chyby ve webovém rozhraní PDT-VALLEXu

Webové rozhraní: http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/vallex.html

  1. http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/S_vallex.html#stát s – překlep v lemmatu, nedokončené příklady… nějaký zbytek
  2. http://ufal.mff.cuni.cz/pdt2.0/visual-data/pdt-vallex/B_vallex.html#být – v-w243f46 být k nezaplacení by možná měl mít značku '~' pro negaci

[ Back to the navigation ] [ Back to the content ]