Table of Contents
Prague English Dependency Treebank
Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině.
Dokumenty
- Interní dokumenty:
- Slovník EngValLex (omezený přístup) PDF
- Functors of attributes governed by all sorts of nounsprivlastky-seznam2.doc
- Seznam anotačních maker pro P(E)DT - verze 13. 3. 07, opraveno 25. 2. 2008 anotacni_makra.pdf
- Manuál pro tektogramatickou anotaci angličtiny, 2006 PDF
- Články a prezentace:
- Prezentace “Constructing an English Valency Lexicon”, Workshop Frontiers in Corpus Annotation, Sydney, 22. 7. 2006: PDF
- Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace PML pro účely anotace PropBanku a navazujících projektů: [https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]]
- Prezentace “Tectogrammatical Representation of English”, PIRE meeting, VMC, 4. 12. 2006, Praha: cin_pire_vmc.ppt
- Prezentace z manuálového sezení 19.4.2007: tectogrammatical-annotation-english.ppt
- Prezentace “Tectogrammatical Representation of English in PEDT”, 3rd PIRE meeting, 6.6.2007, Mertesdorf Německo: lm_pire2007.ppt
- Prezentace ze schůzky 11. 11.2008: Anotace PREC, RHEM a CM:PEDT_discourse_connectives
Data
Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajících souborům Wall Street Journalu.
Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.
SubVersion repository je umístěna na stroji svn:
/home/svn/repos/pedt
Vzdálený přístup k repository je:
svn://svn.ms.mff.cuni.cz/pedt
Pro založení lokální pracovní kopie (working copy) použijte příkaz:
svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel>
Nikdo kromě programátora a správce dat (do 06/2009 Pepa Toman, od 06/2009 Eva Fučíková) by ale neměl mít žádný důvod mít u sebe working copy celé repository.
1) Pro anotátory:
Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:
svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY
kde XY
je kód anotátora.
2) Pro Silvii a případně další “důležité” lidi:
Celá data PEDT (v různém stavu podle aktuální situace) jsou přístupná zde:
svn://svn.ms.mff.cuni.cz/pedt/data/wsj
Body 3) a 4) jsou již pro anotátory zbytečné. Jejich potřeba pominula se zavedením balíčkovacího systému v Tredu. Možná se ale ještě někomu hodí.
3) Resources pro TrEd (schemata, EngVallex)
svn://svn.ms.mff.cuni.cz/pedt/anotace/resources
4) PEDT makra pro TrEd
svn://svn.ms.mff.cuni.cz/pedt/bin/tred_macros/pedt
Anotátoři
* JV: Jana Šindlerová
* LM: Lucie Mladová
* SC: Silvie Cinková
* KC: Kristýna Čermáková
* KT: Kristýna Tomšů
* KV: Kateřina Veselá
* MR: Magdaléna Rysová
* KE: Kateřina Veselovská
* MK: Matěj Korvas
* JM: Jan Mašek
* KR: Kateřina Rysová
* JH: Jan Hajič
* LH: Lenka Šíková
* EK: Ema Krejčová
* VD: Vojta Diatka
bývalí anotátoři:
* AN: Аня Hедолужко