[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
external:pdtc [2016/09/08 18:45]
ufal
external:pdtc [2016/09/08 18:47]
ufal
Line 1: Line 1:
 ====== PDT-C: Prague Dependency Treebank - Czech/Consolidated ====== ====== PDT-C: Prague Dependency Treebank - Czech/Consolidated ======
  
-**PDT-C** budou PDT-korpusy s manuální anotací na českých textech, a to s manuální anotací na všech třech PDT-rovinách. Plán je vydat **PDT**, českou část **PCEDT**, **PDTSC** a **PDT-Faust**. Všechny čtyři korpusy mají manuálně anotovanou tektogramatickou rovinu (a v PDT je celá řada dalších přídavných anotací nad tektogramatickou rovinou). Morfologická a analytická rovina je manuálně anotována jen v PDT. Nejdůležitější krok pro vydani PDT-C je tedy dodělat manuální anotaci morfologie a analytické roviny do české části PCEDT, do PDTSC a do PDT-Faust. Pro automatickou předanotaci chceme maximálně využít všech dostupných nejlepších nástrojů (tagerů a parserů). Anotátoři budu kontrolovat automaticky předanotované stromy v "chytrém" anotačním schématu, které bude vědět, kde je určitě chyba a donutí ji anotátora opravit. +**PDT-C** bude souborné vydaní dosavadních PDT-korpusů s manuální anotací na českých textech, a to s manuální anotací na všech třech PDT-rovinách.  
 +Plán je vydat **PDT**, českou část **PCEDT**, **PDTSC** a **PDT-Faust**. Všechny čtyři korpusy již dnes mají manuálně anotovanou tektogramatickou rovinu (a v PDT je celá řada dalších přídavných anotací nad tektogramatickou rovinou). Morfologická a analytická rovina je manuálně anotována jen v PDT. Nejdůležitější krok pro vydani PDT-C je tedy manuální anotace morfologie a analytické roviny české části PCEDT, PDTSC a PDT-Faust. Pro automatickou předanotaci chceme maximálně využít všech dostupných nejlepších nástrojů (tagerů a parserů). Anotátoři budu kontrolovat automaticky předanotované stromy v "chytrém" anotačním schématu, které bude vědět, kde je určitě chyba a donutí ji anotátora opravit.
  
  

[ Back to the navigation ] [ Back to the content ]