Table of Contents
Prague English Dependency Treebank
Prague English Dependency Treebank je projekt anotace anglických vět Wallstreet Journalu na tektogramatické rovině.
Dokumenty
- Interní dokumenty:
- Články a prezentace:
- Prezentace “Constructing an English Valency Lexicon”, Workshop Frontiers in Corpus Annotation, Sydney, 22. 7. 2006: PDF
- Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: PDF
- Prezentace PML pro účely anotace PropBanku a navazujících projektů: PDF
Data
Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajícím souborům Wallstreet Journalu.
Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.
Pro účely anotace jsou data přístupná přes repositář SubVersion:
/net/data/SVN_ufal/pedt
Vzdálený přístup k repository je (pomocí protokolu ssh):
svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt
Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:
svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt/data/anotace/XY
kde XY
je kód anotátora
Anotátoři
* JV: Jana Vejvodová
* LM: Lucie Mladová
* AN: Anja Nedolůžko
* SC: Silvie Cinková