This is an old revision of the document!
Syntéza vět
TSD-2006 paper (275 kB) - Ptáček, Žabokrtský
TSD-2006 slides (fullscreen html)
PFL072-2007 slides (fullscreen html)
diplomka 2005 (590 kB)
Spuštění generátoru
/f/common/exec/generate_sentence <soubor s TGTS> [číslo stromu] /f/common/exec/generate_sentence <soubor s TGTS>+
Nejasnosti
- jsou uzly pro čárky s funkcí AuxX zbytečné v ATS?
nejsou - měl by se z nich dát odvodit rozdíl RSTR - DES
Problémy z PDT
cmpr9410_001.t.gz#2 - proti exportérům - forma je ve vallexu
cmpr9410_001.t.gz#3 - vokalizace nenajde nasledovníka pro 'k'
ln94203_60MOJE.pls# více → hodněji, jak-2, Vratislava
ln94207_81.t.pls.gz#1 některých - derivace nefungují?
pokusí se odhadnout jakých témat se stránka dotýká - čárky?
TFA:
strom t-ln95049-014-p1s1B - uzel 'samozřejmě'.t.ATT je az za 'člověk'.c versus TMAN1066
ln94206_56.t.gz#4 minimální → proč derivovat na → minimálně
strukturní důvody nefungují, kombinace EXT a adj u nouns co nekončí na ní/tí ! rika t-manual
prevraceni count/counted by se melo dit az po hledani vztaznych konektoru! mohou kvuli prehazovani nesedet koreference a pak se nenalezne vztazny vyraz ;(
degenerate_sentence ln94206_56.t.gz 8: být → by Vc——— nefunguje v morpho-pm
však - PREC v ln94206_56.t.gz 8: jak určit wordorder pozici
ln94206_56.t.gz 1: proč se mnohokrát změnilo v mnoho, uz
Problémy z Euromatrixu
train-1 data scoring
- 0.4783 (16.5.)
- 0.4796 (18.5.)
- 0.4808 (27.8. rev-23)
- 0.4826 (23.10 rev-32)