Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině.
Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajících souborům Wall Street Journalu.
Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.
SubVersion repository je umístěna na stroji svn:
/home/svn/repos/pedt
Vzdálený přístup k repository je:
svn://svn.ms.mff.cuni.cz/pedt
Pro založení lokální pracovní kopie (working copy) použijte příkaz:
svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel>
Nikdo kromě programátora a správce dat (do 06/2009 Pepa Toman, od 06/2009 Eva Fučíková) by ale neměl mít žádný důvod mít u sebe working copy celé repository.
1) Pro anotátory:
Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:
svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY
kde XY
je kód anotátora.
2) Pro Silvii a případně další “důležité” lidi:
Celá data PEDT (v různém stavu podle aktuální situace) jsou přístupná zde:
svn://svn.ms.mff.cuni.cz/pedt/data/wsj
Body 3) a 4) jsou již pro anotátory zbytečné. Jejich potřeba pominula se zavedením balíčkovacího systému v Tredu. Možná se ale ještě někomu hodí.
3) Resources pro TrEd (schemata, EngVallex)
svn://svn.ms.mff.cuni.cz/pedt/anotace/resources
4) PEDT makra pro TrEd
svn://svn.ms.mff.cuni.cz/pedt/bin/tred_macros/pedt
* JV: Jana Šindlerová
* LM: Lucie Mladová
* SC: Silvie Cinková
* KC: Kristýna Čermáková
* KT: Kristýna Tomšů
* KV: Kateřina Veselá
* MR: Magdaléna Rysová
* KE: Kateřina Veselovská
* MK: Matěj Korvas
* JM: Jan Mašek
* KR: Kateřina Rysová
* JH: Jan Hajič
* LH: Lenka Šíková
* EK: Ema Krejčová
* VD: Vojta Diatka
bývalí anotátoři:
* AN: Аня Hедолужко