[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
external:pdtc [2016/09/08 18:45]
ufal
external:pdtc [2022/05/06 11:46]
ufal
Line 1: Line 1:
-====== PDT-C: Prague Dependency Treebank - Czech/Consolidated ====== +====== Prague Dependency Treebank - Consolidated ======
- +
-**PDT-C** budou PDT-korpusy s manuální anotací na českých textech, a to s manuální anotací na všech třech PDT-rovinách. Plán je vydat **PDT**, českou část **PCEDT**, **PDTSC** a **PDT-Faust**. Všechny čtyři korpusy mají manuálně anotovanou tektogramatickou rovinu (a v PDT je celá řada dalších přídavných anotací nad tektogramatickou rovinou). Morfologická a analytická rovina je manuálně anotována jen v PDT. Nejdůležitější krok pro vydani PDT-C je tedy dodělat manuální anotaci morfologie a analytické roviny do české části PCEDT, do PDTSC a do PDT-Faust. Pro automatickou předanotaci chceme maximálně využít všech dostupných nejlepších nástrojů (tagerů a parserů). Anotátoři budu kontrolovat automaticky předanotované stromy v "chytrém" anotačním schématu, které bude vědět, kde je určitě chyba a donutí ji anotátora opravit. +
  
  
 +**PDT-C** bude souborné vydaní dosavadních PDT-korpusů s manuální anotací na českých textech, a to s manuální anotací na všech třech PDT-rovinách. 
 +Plán je vydat **PDT**, českou část **PCEDT**, **PDTSC** a **PDT-Faust**. Všechny čtyři korpusy již dnes mají manuálně anotovanou tektogramatickou rovinu (a v PDT je celá řada dalších přídavných anotací nad tektogramatickou rovinou). Morfologická a analytická rovina byla manuálně anotována jen v PDT. 
 +Nejdůležitější krok pro vydani PDT-C je tedy manuální anotace morfologie (hotove ve verzi PDT-C 1.0) a analytické roviny (verze 2.0) v české části PCEDT, v PDTSC a PDT-Faust. 

[ Back to the navigation ] [ Back to the content ]