[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
external:pdt [2006/11/27 15:23]
stepanek
external:pdt [2008/05/28 01:09]
stepanek
Line 1: Line 1:
 ====== Prague Dependency Treebank 2.0 ====== ====== Prague Dependency Treebank 2.0 ======
  
 +===== Cesty =====
 +Kopie CD:
 +
 +  /net/projects/pdt/pdt20/
  
  
Line 11: Line 15:
 [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|Velký manuál český]] [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_cz_def.pdf|Velký manuál český]]
 [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_en_def.pdf|Velký manuál anglický]] [[http://ufal.mff.cuni.cz/~semecky/pdt/tr_en_def.pdf|Velký manuál anglický]]
 +
 +
 +===== PDT 2.5 =====
 +
 +[[:internal:pdt25|Chyby a změny v datech či koncepci]].
 +
 +**Zde by se měly shromažďovat poznámky k PDT 2.0: kde jsou v datech chyby, co je třeba změnit, rozmyslet apod.**
 +
 +
 +==== w-rovina ====
 +=== Některé tokeny obsahují tvrdou mezeru ===
 +
 +
 +  amw/train-3/mf920901_006.w.gz:    <token>v pĹĂ­rodÄ/token>
 +  amw/train-4/mf920902_138.w.gz:    <token>Â summit</token>
 +
 +=== Za některou interpunkcí jsou špatně mezery ===
 +
 +Mezera se píše za tečku, čárku, pravou závorku, ale před levou závorku. U pomlček a uvozovek se to asi nedá poznat, protože nepoznáme pravou a levou :-(
 +
 +==== m-rovina ====
 +
 +==== a-rovina ====
 +
 +=== adverbia s objekty - nejméně z poloviny chyby ===
 +
 +  ntred -d iso-8859-2 -NTe '
 +  if ($this->attr("m/tag") =~ /^D/
 +      and my $ch = (first { $_->{afun} eq "Obj" } PML_A::GetEChildren($this))[0]){
 +    writeln($this->attr("m/lemma"),".",$this->{afun}
 +      ,"\t",$ch->attr("m/form")
 +      ,"\t",PML_A::GetSentenceString($root))
 +  }
 +  '  | grep -v 'Coord\|Apos\|ExD\|AuxC' | sort
 +
 +=== "Zina bosa" ===
 +
 +chybně ''Atv''
 +
 +=== chybně ''_Co'' ===
 +
 +''a-ln94204-107-p15s2'' a další: ''is_member'' musí mít rodiče ''Coord'' nebo ''Apos'' (skrz ''Aux[CP]'')
 +
 +
 +
 +==== t-rovina ====
 +
 +=== Resultativ a hortativ ===
 +
 +Gramatémy ''resultative=res1'' a ''deontmod=hrt'' jsou špatně vyplněné:
 +K prvnímu nepatří případy s infinitivem "být", k druhému je naopak takový infinitiv potřeba.
 +
 +=== Chyby v Rcp ===
 +
 +  ntred -t PML_T -NTe '
 +    if($this->{t_lemma} eq "#Rcp"){
 +      my @nodes = map { GetNodeByID($_) } ListV($this->{"coref_gram.rf"});
 +      FPosition() if @nodes != 1;
 +    }'
 +
 +=== Je možné, aby doplňková šipka vedla do jiné věty? ===
 +
 +''/net/projects/pdt/pdt20/data/binary/tamw/train-5/ln95048_066.t.pls.gz##30''
 +nechybí tam spíš ''ACT'' pod ''#EmpVerb?''
 +
 +=== Modalita u kvazikomplexních uzlů ===
 +
 +Jak řešit případ "Musel do hotelu"? Je tam doplněné ''#EmpVerb'', které by mělo být modální, ale jako ''qcomplex'' má prázdný atribut ''gram''. "Muset" je ale u něj v ''a/aux.rf!''

[ Back to the navigation ] [ Back to the content ]