This is an old revision of the document!
Table of Contents
Prague Dependency Treebank 2.0
Cesty
Kopie CD:
/net/projects/pdt/pdt20/
Manuály pro tektogramatickou rovinu
PDT 2.5
Zde by se měly shromažďovat poznámky k PDT 2.0: kde jsou v datech chyby, co je třeba změnit, rozmyslet apod.
w-rovina
- některé tokeny obsahují tvrdou mezeru:
amw/train-3/mf920901_006.w.gz: <token>v pĹĂrodÄ/token> amw/train-4/mf920902_138.w.gz: <token> summit</token>
m-rovina
a-rovina
- adverbia s objekty - nejméně z poloviny chyby
ntred -d iso-8859-2 -NTe ' if ($this->attr("m/tag")=~/^D/ and my $ch=(first {$_->{afun}eq"Obj"} PML_A::GetEChildren($this))[0]){ writeln($this->attr("m/lemma"),".",$this->{afun} ,"\t",$ch->attr("m/form") ,"\t",PML_A::GetSentenceString($root)) } ' | grep -v 'Coord\|Apos\|ExD\|AuxC' | sort