Both sides previous revision
Previous revision
Next revision
|
Previous revision
|
user:dusek:tahaky [2011/11/09 17:05] dusek |
user:dusek:tahaky [2014/04/08 09:47] (current) dusek |
| |
| ==== Vim ==== |
| |
| Úprava jmen v BibTeXu ze Zotera |
| 1,$s/{\([a-z-]\+\)_[a-z:-]\+_\([0-9]\{4\}\),/{\u\1-\2,/ |
| |
| Zkrácení autorů |
| g/\(author\|editor\)/s/, \([A-ZÁČĎĚÉÍŇŘŠŤŮÚÝŽ]\)[a-záčďěéíňřšťůúýžäöüß]*\(\([- ][A-ZÁČĎĚÉÍŇŘŠŤŮÚÝŽ]\)[a-záčďěéíňřšťůúýžäöüß]*\)\?\( and\|}\)/, \1.\3\4/g |
| |
| Vyházení zbytečností |
| g/\(abstract\|url\|urldate\|language\|keywords\|file\|shorttitle\|month\|lccn\) =/d |
| |
| Oprava divných závorek, které ničí syntax highlighting |
| 1,$s/({\([^({]*\))}/{(\1)}/g |
| |
| ==== Treex ==== |
| |
== Úprava něčeho, co vypisuje nějaký log (zde t-lemmata) == | == Úprava něčeho, co vypisuje nějaký log (zde t-lemmata) == |
| |
treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom A2T::EN::FixTlemmas -- pcedt-formemes2a/*.treex.gz 2>&1 | tee log.txt | treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom A2T::EN::FixTlemmas -- pcedt-formemes2a/*.treex.gz 2>&1 | tee log.txt |
| |
== Změna formémů a výpis pouze změněných == | == Změna formémů a výpis pouze změněných == |
| |
treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=cs selector=autom Util::Eval tnode='$tnode->wild->{orig_formeme} = $tnode->formeme;' A2T::CS::SetFormeme use_version=2 Util::Eval tnode='print $tnode->get_address, " ", $tnode->wild->{orig_formeme}, " " , $tnode->formeme, "\n" if $tnode->wild->{orig_formeme} ne $tnode->formeme);' -- pcedt-formemes2a/*.treex.gz | tee log1.txt | Česky: |
| treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=cs selector=autom Util::Eval tnode='$tnode->wild->{orig_formeme} = $tnode->formeme;' A2T::CS::SetFormeme use_version=2 Util::Eval tnode='print $tnode->get_address, " ", $tnode->wild->{orig_formeme}, " " , $tnode->formeme, "\n" if ($tnode->wild->{orig_formeme} ne $tnode->formeme);' -- pcedt-formemes2a/*.treex.gz | tee log1.txt |
| |
| Anglicky: |
| treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom Util::Eval tnode='$tnode->wild->{orig_formeme} = $tnode->formeme;' A2T::EN::SetFormeme2 Util::Eval tnode='print $tnode->get_address, " ", $tnode->wild->{orig_formeme}, " " , $tnode->formeme, "\n" if ($tnode->wild->{orig_formeme} ne $tnode->formeme);' -- pcedt-formemes2a/*.treex.gz | tee log4.txt |
| |
== Změna afunů a výpis pouze změněných == | == Změna afunů a výpis pouze změněných == |
| |
treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom Util::Eval anode='$anode->wild->{orig_afun} = $anode->afun;' W2A::En::SetAfun Util::Eval anode='print $anode->get_address, " ", $anode->wild->{orig_afun}, " " , $anode->afun, "\n" if $anode->wild->{orig_afun} ne $anode->afun);' -- pcedt-formemes2a/*.treex.gz | tee log3.txt | treex --qsub "-hard -l mem_free=3g -l act_mem_free=3g" -p -j 30 Util::SetGlobal language=en selector=autom Util::Eval anode='$anode->wild->{orig_afun} = $anode->afun;' W2A::EN::SetAfun Util::Eval anode='print $anode->get_address, " ", $anode->wild->{orig_afun}, " " , $anode->afun, "\n" if ($anode->wild->{orig_afun} ne $anode->afun);' -- pcedt-formemes2a/*.treex.gz | tee log3.txt |
| |
| === Cachování === |
| |
| * Cachování -- treex --cache --survive, pak use_cache=1 u bloků, které mají být záchytné body: tj. typicky 1. blok a ten před tím, který měním |
| |
| |
| ==== PML-TQ ==== |
| |
| === Prependované nominální atributy === |
| |
| t-node [ gram/sempos ~ '^n', a/lex.rf $a1, child $b ]; |
| t-node $b := [ gram/sempos ~ '^n', a/lex.rf $a2 ]; |
| a-node $a1 := [ order-follows $a2 ]; |
| a-node $a2 := [ m/tag ~ '^N' ]; |
| |
| === Složité predikáty === |
| |
| t-node [ gram/sempos = 'v', 1+x a/aux.rf a-node [ m/tag ~ '^V', afun != 'AuxV' ], a/lex.rf a-node [] ]; |