[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Syntéza vět

TSD-2006 paper (275 kB) - Ptáček, Žabokrtský
TSD-2006 slides (fullscreen html)
PFL072-2007 slides (fullscreen html)
diplomka 2005 (590 kB)

Spuštění generátoru

/f/common/exec/generate_sentence <soubor s TGTS> [číslo stromu]
/f/common/exec/generate_sentence <soubor s TGTS>+

Nejasnosti

nejsou - měl by se z nich dát odvodit rozdíl RSTR - DES

Problémy z PDT

cmpr9410_001.t.gz#2 - proti exportérům - forma je ve vallexu
cmpr9410_001.t.gz#3 - vokalizace nenajde nasledovníka pro 'k'
ln94203_60MOJE.pls# více → hodněji, jak-2, Vratislava
ln94207_81.t.pls.gz#1 kterých - derivace nefungují


pokusí se odhadnout jakých témat se stránka dotýká - čárky?

TFA:
strom t-ln95049-014-p1s1B - uzel 'samozřejmě'.t.ATT je az za 'člověk'.c versus TMAN1066

ln94206_56.t.gz#4 minimální → proč derivovat na → minimálně
strukturní důvody nefungují, kombinace EXT a adj u nouns co nekončí na ní/tí ! rika t-manual

prevraceni count/counted by se melo dit az po hledani vztaznych konektoru! mohou kvuli prehazovani nesedet koreference a pak se nenalezne vztazny vyraz ;(

degenerate_sentence ln94206_56.t.gz 8: být → by Vc——— nefunguje v morpho-pm

však - PREC v ln94206_56.t.gz 8: jak určit wordorder pozici

ln94206_56.t.gz 1: proč se mnohokrát změnilo v mnoho, uz

ln95049-008-p8s1w20: tag == J, ?
cmpr9410-001-p4s2a0: gram/number == pl ?
cmpr9410-001-p4s2w5: Slovenský: t_lemma není podporované morfologií, jen “slovenský”, ale Český/český existuje obé

Problémy z Euromatrixu

přivlastňovací zájmena
který se nechytlo jako connector klauzi

train-1 data scoring


[ Back to the navigation ] [ Back to the content ]