[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
external:pdt [2006/11/27 15:23]
stepanek
external:pdt [2008/05/28 00:47]
stepanek
Line 1: Line 1:
 ====== Prague Dependency Treebank 2.0 ====== ====== Prague Dependency Treebank 2.0 ======
  
 +===== Cesty =====
 +Kopie CD:
 +
 +  /net/projects/pdt/pdt20/
  
  
Line 11: Line 15:
 [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|Velký manuál český]] [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|Velký manuál český]]
 [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_en_def.pdf|Velký manuál anglický]] [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_en_def.pdf|Velký manuál anglický]]
 +
 +
 +===== PDT 2.5 =====
 +**Zde by se měly shromažďovat poznámky k PDT 2.0: kde jsou v datech chyby, co je třeba změnit, rozmyslet apod.**
 +
 +
 +
 +==== w-rovina ====
 +  * některé tokeny obsahují tvrdou mezeru:
 +
 +  amw/train-3/mf920901_006.w.gz:    <token>v pĹĂ­rodÄ/token>
 +  amw/train-4/mf920902_138.w.gz:    <token>Â summit</token>
 +
 +==== m-rovina ====
 +
 +
 +
 +
 +
 +
 +==== a-rovina ====
 +  * adverbia s objekty - nejméně z poloviny chyby
 +
 +  ntred -d iso-8859-2 -NTe '
 +  if ($this->attr("m/tag") =~ /^D/
 +      and my $ch = (first { $_->{afun} eq "Obj" } PML_A::GetEChildren($this))[0]){
 +    writeln($this->attr("m/lemma"),".",$this->{afun}
 +      ,"\t",$ch->attr("m/form")
 +      ,"\t",PML_A::GetSentenceString($root))
 +  }
 +  '  | grep -v 'Coord\|Apos\|ExD\|AuxC' | sort
 +
 +  * "Zina bosa" - chybně ''Atv''
 +
 +==== t-rovina ====
 +

[ Back to the navigation ] [ Back to the content ]