Table of Contents
s4001
${PROG1} $ARG < $INDATA > $OUTDATA
morfo config.cfg < query
konfigurak
Log=./morfo.log
CharSet=iso-8859-2
CacheEntries=20000
Dictionary=./hgddCZ.cpd
NF=./unhandled.log
WildCards=Positional
TagTable=./b2800a.f2o
query
unixove newliny
aspon jeden novy radek
napr
<Gil>abeceda<Git>NFS7A
files
s4001.fl flexi scanner
zdrojaky
hb_arg
prej pro predavani parametru programum
hb_base
hb_proto.h
proto.h
hb_cpd
compiled dictionary retrieval
uziva: hh_cp - konverzni tabulka (hh_tab a hh_inv_tab)
hb_cp
code page konverze
hb_hash
hashovani stringu
hg_modd
morfology genenration -
s4001.fl - vola se na to flex
madarska notace
f - flag
sz - string zero
b - bool
Flex
- scanner dělá ze zdrojáku tokeny
VAR ics142: INTEGER; variable declaration
VAR ID(ics142) COLON ID(INTEGER) SEMICOLON
* flex generuje scannery
====== Záhady ======
kdyz zkompiluju prvotní zdroják, tak mi to pod cygwinem segfaultne, pokud jako prvni dotaz polozim neco s wildcardem
napr
<code>
<Gil>abeceda<Git>NNF.7—–A—-
</code>
===== dotazy =====
* hf_analyze.cpp 2488 - opravdu jsou potreba 2 for cykly pres tagy pro IgnoreTag(s)?
* hf_csts.cpp 822 - distinct_tags stayed unpopulated WHEN in→was_lemma_specified && !HF_UPDATE
* k čemu je fAll flag z
* del if extra - LexDelIfExtra=_s_a_n_h_e_l_v, seznam