[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Prague English Dependency Treebank

Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině.

Dokumenty

Data

PEDT data browser

Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajících souborům Wall Street Journalu.
Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.

SubVersion repository je umístěna na stroji svn:

/home/svn/repos/pedt

Vzdálený přístup k repository je:

svn://svn.ms.mff.cuni.cz/pedt

Pro založení lokální pracovní kopie (working copy) použijte příkaz:

svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel>

Rozumné je však “checkoutovat” pouze tyto části repository:
1) Data

svn://svn.ms.mff.cuni.cz/pedt/data/wsj

2) Resources pro TrEd (schemata, EngVallex)

svn://svn.ms.mff.cuni.cz/pedt/anotace/resources

3) PEDT makra pro TrEd

svn://svn.ms.mff.cuni.cz/pedt/bin/tred_macros/pedt

4) Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:

svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY

kde XY je kód anotátora.

5) Soubory pro anotaci discourse_connectives jsou zde (kvuli check-outu):

svn://svn.ms.mff.cuni.cz/pedt/data/anotace/discourse_connectives/XX

kde XX je cislo od 00 do 21.

Anotátoři

* JV: Jana Šindlerová
* LM: Lucie Mladová
* AN: Аня Hедолужко
* SC: Silvie Cinková
* KC: Kristýna Čermáková
* KT: Kristýna Tomšů
* KV: Kateřina Veselá
* MR: Magdaléna Rysová
* KE: Kateřina Veselovská
* MK: Matěj Korvas

TO-DO

Seznam úkolů

Anotace vybraných jevů

Anotace rematizátorů a konektorů


[ Back to the navigation ] [ Back to the content ]