Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
| external:pdtc [2016/09/08 18:54] ufal | external:pdtc [2025/04/24 15:30] (current) mikulova | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| - | ====== | + | ====== Prague Dependency Treebank - Consolidated ====== | 
| - | **PDT-C** bude souborné vydaní dosavadních PDT-korpusů s manuální anotací na českých textech, a to s manuální anotací na všech třech PDT-rovinách. | ||
| - | Plán je vydat **PDT**, českou část **PCEDT**, **PDTSC** a **PDT-Faust**. Všechny čtyři korpusy již dnes mají manuálně anotovanou tektogramatickou rovinu (a v PDT je celá řada dalších přídavných anotací nad tektogramatickou rovinou). Morfologická a analytická rovina je manuálně anotována jen v PDT. Nejdůležitější krok pro vydani PDT-C je tedy manuální anotace morfologie a analytické roviny v české části PCEDT, v PDTSC a PDT-Faust. Pro automatickou předanotaci chceme maximálně využít všech dostupných nejlepších nástrojů (tagerů a parserů). Anotátoři budu kontrolovat automaticky předanotované stromy v " | ||
| - | ===== Předpokládaný postup řešení ===== | + | **PDT-C** bude souborné vydaní dosavadních PDT-korpusů s manuální | 
| - | 1. zpracovat data všemi dostupnými nástroji | + | Plán je vydat **PDT**, | 
| - | 2. manuální | + | Nejdůležitější krok pro vydani PDT-C je tedy manuální anotace morfologie | 
| - | 3. vyvinout anotačni nástroj | + | |
| - | 4. začít anotovat morfologii | + | |
| - | 5. anotační nástroj na analytickou rovinu | + | |
| - | 6. analytická anotace | + | |
| - | 7. PDT-vallex | + | |
| - | 8. finalni kontroly, opravy, validace, CD, vydani, propagace... | + | |
| - | 9. sladké odměny pro všechny zúčastněné | + | |
| - | ===== DATA ===== | + | [[.pdtc: | 
| - | ===== NÁSTROJE ===== | + | [[.pdtc: | 
| - | ===== Kdo to bude dělat ===== | + | |
