Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
external:pedt [2007/03/13 09:05] mladova |
external:pedt [2013/02/18 14:38] (current) fucikova |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Prague English Dependency Treebank ====== | ====== Prague English Dependency Treebank ====== | ||
Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině. | Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
Line 9: | Line 14: | ||
* Instalace EngValLex editoru [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.html|HTML]] [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.pdf|PDF]] | * Instalace EngValLex editoru [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.html|HTML]] [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.pdf|PDF]] | ||
* Slovník EngValLex (omezený přístup) [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/engvallex.pdf|PDF]] | * Slovník EngValLex (omezený přístup) [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/engvallex.pdf|PDF]] | ||
- | * Functors of attributes governed by all sorts of nouns {{:user:semecky:privlastky-seznam2.doc|privlastky-seznam2.doc}} | + | * Functors of attributes governed by all sorts of nouns{{:user:semecky:privlastky-seznam2.doc|privlastky-seznam2.doc}} |
- | * Seznam anotačních maker pro P(E)DT - verze 13.3.07{{:external:|makra.doc}} | + | * Seznam anotačních maker pro P(E)DT - verze 13. 3. 07, opraveno 25. 2. 2008 {{:external:anotacni_makra.pdf|anotacni_makra.pdf}} |
+ | * Manuál pro tektogramatickou anotaci angličtiny, 2006 [[http://ufal.mff.cuni.cz/~cinkova/TR_En.pdf|PDF]] | ||
* Články a prezentace: | * Články a prezentace: | ||
Line 17: | Line 22: | ||
* Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jirka.pdf|PDF]] | * Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jirka.pdf|PDF]] | ||
* Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jana.pdf|PDF]] | * Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jana.pdf|PDF]] | ||
- | * Prezentace PML pro účely anotace PropBanku a navazujících projektů: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]] | + | * Prezentace PML pro účely anotace PropBanku a navazujících projektů: [https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]] |
* Prezentace "Tectogrammatical Representation of English", PIRE meeting, VMC, 4. 12. 2006, Praha: {{:external:cin_PIRE_VMC.ppt}} | * Prezentace "Tectogrammatical Representation of English", PIRE meeting, VMC, 4. 12. 2006, Praha: {{:external:cin_PIRE_VMC.ppt}} | ||
- | + | * Prezentace z manuálového sezení 19.4.2007: {{:external:tectogrammatical-annotation-english.ppt}} | |
- | + | * Prezentace "Tectogrammatical Representation of English in PEDT", 3rd PIRE meeting, 6.6.2007, Mertesdorf Německo: {{external:lm_pire2007.ppt}} | |
+ | * Prezentace ze schůzky 11. 11.2008: Anotace PREC, RHEM a CM:{{external:anotace-konektoru-rematizatoru-a-cm.pdf|PEDT_discourse_connectives}} | ||
===== Data ===== | ===== Data ===== | ||
- | [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/data.php|PEDT data browser]] | + | [[https://blackbird.ms.mff.cuni.cz/toman/pedt/|PEDT data browser]] |
- | Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajícím souborům Wall Street Journalu. | + | Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajících souborům Wall Street Journalu. |
Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ. | Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ. | ||
- | Pro účely anotace jsou data přístupná přes repositář SubVersion: | + | SubVersion repository je umístěna na stroji svn: |
- | /net/data/SVN_ufal/pedt | + | /home/svn/repos/pedt |
- | Vzdálený přístup k repository je (pomocí protokolu ssh): | + | Vzdálený přístup k repository je: |
- | svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt | + | svn://svn.ms.mff.cuni.cz/pedt |
+ | Pro založení lokální pracovní kopie (working copy) použijte příkaz: | ||
+ | svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel> | ||
+ | |||
+ | Nikdo kromě programátora a správce dat (do 06/2009 Pepa Toman, od 06/2009 Eva Fučíková) by ale neměl mít žádný důvod mít u sebe working copy celé repository. | ||
+ | |||
+ | 1) Pro anotátory: | ||
Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde: | Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde: | ||
- | svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt/data/anotace/XY | + | svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY |
- | kde ''XY'' je kód anotátora | + | kde ''XY'' je kód anotátora. |
+ | 2) Pro Silvii a případně další "důležité" lidi: | ||
+ | Celá data PEDT (v různém stavu podle aktuální situace) jsou přístupná zde: | ||
+ | |||
+ | svn://svn.ms.mff.cuni.cz/pedt/data/wsj | ||
+ | |||
+ | Body 3) a 4) jsou již pro anotátory zbytečné. Jejich potřeba pominula se zavedením balíčkovacího systému v Tredu. Možná se ale ještě někomu hodí. | ||
+ | |||
+ | 3) Resources pro TrEd (schemata, EngVallex) | ||
+ | svn://svn.ms.mff.cuni.cz/pedt/anotace/resources | ||
+ | |||
+ | 4) PEDT makra pro TrEd | ||
+ | svn://svn.ms.mff.cuni.cz/pedt/bin/tred_macros/pedt | ||
===== Anotátoři ===== | ===== Anotátoři ===== | ||
- | * **JV**: Jana Vejvodová | + | * **JV**: [[Jana Šindlerová]] |
* **LM**: Lucie Mladová | * **LM**: Lucie Mladová | ||
- | * **AN**: Аня Hедолужко | ||
* **SC**: Silvie Cinková | * **SC**: Silvie Cinková | ||
+ | * **KC**: Kristýna Čermáková | ||
+ | * **KT**: Kristýna Tomšů | ||
+ | * **KV**: Kateřina Veselá | ||
+ | * **MR**: Magdaléna Rysová | ||
+ | * **KE**: Kateřina Veselovská | ||
+ | * **MK**: Matěj Korvas | ||
+ | * **JM**: Jan Mašek | ||
+ | * **KR**: Kateřina Rysová | ||
+ | * **JH**: Jan Hajič | ||
+ | * **LH**: Lenka Šíková | ||
+ | * **EK**: Ema Krejčová | ||
+ | * **VD**: Vojta Diatka | ||
+ | bývalí anotátoři: | ||
+ | * **AN**: Аня Hедолужко | ||
====== TO-DO ====== | ====== TO-DO ====== | ||
[[internal:pedt.TO-DO|Seznam úkolů]] | [[internal:pedt.TO-DO|Seznam úkolů]] | ||
+ | |||
+ | |||
+ | ===== Anotace vybraných jevů ===== | ||
+ | [[Anotace rematizátorů a konektorů]] |