Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Last revision Both sides next revision | ||
user:zeman:brilluv-tagger [2007/10/24 16:46] zeman Oprava. |
user:zeman:brilluv-tagger [2007/10/24 16:59] zeman Model kontextových pravidel. |
||
---|---|---|---|
Line 44: | Line 44: | ||
< | < | ||
300 pdt.lexruleoutfile</ | 300 pdt.lexruleoutfile</ | ||
+ | |||
===== Model kontextových pravidel ===== | ===== Model kontextových pravidel ===== | ||
- | < | + | Vytvoříme dva slovníky značek ke slovům. První bude vyroben z poloviny trénovacích dat a bude se používat během trénování pravidel. Druhý bude vyroben ze všech trénovacích dat a bude se používat při ostrém nasazení již natrénovaného taggeru. |
+ | |||
+ | < | ||
+ | cat pdt-train-*.brill | perl ../ | ||
+ | |||
+ | Odznačkujeme si druhou část korpusu a zkusíme ji označkovat počátečním taggerem, to budeme potřebovat při trénování pravidel. Tagger nemůžeme spustit, dokud se nenatrénuje model neznámých slov. | ||
+ | |||
+ | < | ||
+ | tagger pdt.training.lexicon pdt-train-2.tok pdt.bigbigramlist pdt.lexruleoutfile /dev/null -w bigwordlist -i pdt.dummy-tagged-corpus > / | ||
+ | |||
+ | Naučíme se kontextová pravidla. | ||
+ | |||
+ | < |