This is an old revision of the document!
Table of Contents
Prague English Dependency Treebank
Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině.
Dokumenty
- Interní dokumenty:
- Slovník EngValLex (omezený přístup) PDF
- Functors of attributes governed by all sorts of nounsprivlastky-seznam2.doc
- Seznam anotačních maker pro P(E)DT - verze 13. 3. 07, opraveno 25. 2. 2008 anotacni_makra.pdf
- Manuál pro tektogramatickou anotaci angličtiny, 2006 PDF
- Články a prezentace:
- Prezentace “Constructing an English Valency Lexicon”, Workshop Frontiers in Corpus Annotation, Sydney, 22. 7. 2006: PDF
- Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace PML pro účely anotace PropBanku a navazujících projektů: [https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]]
- Prezentace “Tectogrammatical Representation of English”, PIRE meeting, VMC, 4. 12. 2006, Praha: cin_pire_vmc.ppt
- Prezentace z manuálového sezení 19.4.2007: tectogrammatical-annotation-english.ppt
- Prezentace “Tectogrammatical Representation of English in PEDT”, 3rd PIRE meeting, 6.6.2007, Mertesdorf Německo: lm_pire2007.ppt
Data
Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajících souborům Wall Street Journalu.
Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.
SubVersion repository je umístěna na stroji svn:
/home/svn/repos/pedt
Vzdálený přístup k repository je:
svn://svn.ms.mff.cuni.cz/pedt
Pro založení lokální pracovní kopie (working copy) použijte příkaz:
svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel>
Rozumné je však “checkoutovat” pouze tyto části repository:
1) Data
svn://svn.ms.mff.cuni.cz/pedt/data/svn
2) Resources pro TrEd (schemata, EngVallex)
svn://svn.ms.mff.cuni.cz/pedt/anotace/resources
3) PEDT makra pro TrEd
svn://svn.ms.mff.cuni.cz/pedt/bin/tred_macros/pedt
Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:
svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY
kde XY
je kód anotátora
Anotátoři
* JV: Jana Šindlerová
* LM: Lucie Mladová
* AN: Аня Hедолужко
* SC: Silvie Cinková
* KC: Kristýna Čermáková