Další informace jsou k dispozici na interních stránkách projektu.
Vstup: automaticky předzpracované tektogramatické stromy (parser Vaška Klimeše).
Anotace je rozdělena do pěti po sobě následujících fází:
Podrobněji: pcedt_cz_postup
15. 1. 2007 byla zahájena první fáze anotace (kav, krc).
26. 3. 2007 se počet anotátorek zvýšil ze dvou na pět (kav, mao, anp, olh, alk).
Od 1. 7. 2007 anotujeme ve čtyřech (kav, mao, olh, alk).
Od 1. 6. 2008 anotuje pět anotátorek (kav, mao,olh, alk, zub).
Od září 2008 anotuje osm anotátorek (kav, mao, olh, alk, mil, leh, jif, ivk).
V březnu 2010 byl první průchod daty dokončen!!! Hurá!
Přednostně anotujeme data, která prošla revizí překladu (více zde).
Anotujeme v nastavení:
Contex: PML_Cz_T_Anot
Style: PML_T_Anot
Dokumenty:
Postupně vznikají automatické kontroly správnosti anotace.
Opravu již oanotovaných dat provádějí anotátoři zpětně (když se sejde dostatečný objem dat) na základě automaticky vygenerovaných filelistů.
Dokumenty:
Sazba za odevzdanou práci: 23 Kč/věta.
Opravy dat se neproplácí.