This is an old revision of the document!
Table of Contents
Prague English Dependency Treebank
Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině.
Dokumenty
- Interní dokumenty:
- Slovník EngValLex (omezený přístup) PDF
- Functors of attributes governed by all sorts of nouns privlastky-seznam2.doc
- Seznam anotačních maker pro P(E)DT - verze 13. 3. 07 nova_makra.doc
- Manuál pro tektogramatickou anotaci angličtiny, 2006
- Články a prezentace:
- Prezentace “Constructing an English Valency Lexicon”, Workshop Frontiers in Corpus Annotation, Sydney, 22. 7. 2006: PDF
- Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace PML pro účely anotace PropBanku a navazujících projektů: PDF
- Prezentace “Tectogrammatical Representation of English”, PIRE meeting, VMC, 4. 12. 2006, Praha: cin_pire_vmc.ppt
Data
Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajícím souborům Wall Street Journalu.
Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.
Pro účely anotace jsou data přístupná přes repositář SubVersion:
/net/data/SVN_ufal/pedt
Vzdálený přístup k repository je (pomocí protokolu ssh):
svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt
Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:
svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt/data/anotace/XY
kde XY
je kód anotátora
Anotátoři
* JV: Jana Vejvodová
* LM: Lucie Mladová
* AN: Аня Hедолужко
* SC: Silvie Cinková