This is an old revision of the document!
Vim
Úprava jmen v BibTeXu ze Zotera
g/file =/d 1,$s/{\([a-z-]\+\)_[a-z:-]\+_\([0-9]\{4\}\),/{\u\1-\2,/
Treex
Úprava něčeho, co vypisuje nějaký log (zde t-lemmata)
treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom A2T::EN::FixTlemmas -- pcedt-formemes2a/*.treex.gz 2>&1 | tee log.txt
Změna formémů a výpis pouze změněných
Česky:
treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=cs selector=autom Util::Eval tnode='$tnode->wild->{orig_formeme} = $tnode->formeme;' A2T::CS::SetFormeme use_version=2 Util::Eval tnode='print $tnode->get_address, " ", $tnode->wild->{orig_formeme}, " " , $tnode->formeme, "\n" if ($tnode->wild->{orig_formeme} ne $tnode->formeme);' -- pcedt-formemes2a/*.treex.gz | tee log1.txt
Anglicky:
treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom Util::Eval tnode='$tnode->wild->{orig_formeme} = $tnode->formeme;' A2T::EN::SetFormeme2 Util::Eval tnode='print $tnode->get_address, " ", $tnode->wild->{orig_formeme}, " " , $tnode->formeme, "\n" if ($tnode->wild->{orig_formeme} ne $tnode->formeme);' -- pcedt-formemes2a/*.treex.gz | tee log4.txt
Změna afunů a výpis pouze změněných
treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom Util::Eval anode='$anode->wild->{orig_afun} = $anode->afun;' W2A::EN::SetAfun Util::Eval anode='print $anode->get_address, " ", $anode->wild->{orig_afun}, " " , $anode->afun, "\n" if ($anode->wild->{orig_afun} ne $anode->afun);' -- pcedt-formemes2a/*.treex.gz | tee log3.txt
Cachování
- Cachování – treex –cache –survive, pak use_cache=1 u bloků, které mají být záchytné body: tj. typicky 1. blok a ten před tím, který měním
PML-TQ
Prependované nominální atributy
t-node [ gram/sempos ~ '^n', a/lex.rf $a1, child $b ]; t-node $b := [ gram/sempos ~ '^n', a/lex.rf $a2 ]; a-node $a1 := [ order-follows $a2 ]; a-node $a2 := [ m/tag ~ '^N' ];
Složité predikáty
t-node [ gram/sempos = 'v', 1+x a/aux.rf a-node [ m/tag ~ '^V', afun != 'AuxV' ], a/lex.rf a-node [] ];