[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:pedt [2007/03/13 09:10]
mladova
external:pedt [2013/02/18 14:38] (current)
fucikova
Line 1: Line 1:
 ====== Prague English Dependency Treebank ====== ====== Prague English Dependency Treebank ======
 Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině. Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině.
 +
 +
 +
  
  
Line 11: Line 14:
           * Instalace EngValLex editoru [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.html|HTML]] [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.pdf|PDF]]           * Instalace EngValLex editoru [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.html|HTML]] [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.pdf|PDF]]
           * Slovník EngValLex (omezený přístup) [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/engvallex.pdf|PDF]]           * Slovník EngValLex (omezený přístup) [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/engvallex.pdf|PDF]]
-          * Functors of attributes governed by all sorts of nouns {{:user:semecky:privlastky-seznam2.doc|privlastky-seznam2.doc}} +          * Functors of attributes governed by all sorts of nouns{{:user:semecky:privlastky-seznam2.doc|privlastky-seznam2.doc}} 
-           * Seznam anotačních maker pro P(E)DT - verze 13. 3. 07 {{:external:nova_makra.doc|nova_makra.doc}}  +           * Seznam anotačních maker pro P(E)DT - verze 13. 3. 07, opraveno 25. 2. 2008 {{:external:anotacni_makra.pdf|anotacni_makra.pdf}}  
 +           * Manuál pro tektogramatickou anotaci angličtiny, 2006 [[http://ufal.mff.cuni.cz/~cinkova/TR_En.pdf|PDF]]
  
     * Články a prezentace:     * Články a prezentace:
Line 19: Line 22:
           * Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jirka.pdf|PDF]]           * Prezentace slovníku EngValLex (Jirka), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jirka.pdf|PDF]]
           * Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jana.pdf|PDF]]           * Prezentace slovníku EngValLex (Jana), Boulder, Colorado, 4. 10. 2006: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/boulder_jana.pdf|PDF]]
-          * Prezentace PML pro účely anotace PropBanku a navazujících projektů: [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]]+          * Prezentace PML pro účely anotace PropBanku a navazujících projektů: [https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]]
           * Prezentace "Tectogrammatical Representation of English", PIRE meeting, VMC, 4. 12. 2006, Praha: {{:external:cin_PIRE_VMC.ppt}}            * Prezentace "Tectogrammatical Representation of English", PIRE meeting, VMC, 4. 12. 2006, Praha: {{:external:cin_PIRE_VMC.ppt}} 
- +          * Prezentace z manuálového sezení 19.4.2007: {{:external:tectogrammatical-annotation-english.ppt}} 
- +          * Prezentace "Tectogrammatical Representation of English in PEDT", 3rd PIRE meeting, 6.6.2007, Mertesdorf Německo: {{external:lm_pire2007.ppt}} 
 +          * Prezentace ze schůzky 11. 11.2008: Anotace PREC, RHEM a CM:{{external:anotace-konektoru-rematizatoru-a-cm.pdf|PEDT_discourse_connectives}}
  
  
 ===== Data ===== ===== Data =====
  
-[[https://blackbird.ms.mff.cuni.cz/semecky/pedt/data.php|PEDT data browser]]+[[https://blackbird.ms.mff.cuni.cz/toman/pedt/|PEDT data browser]]
  
-Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajícím souborům Wall Street Journalu.+Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajících souborům Wall Street Journalu.
 Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ. Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.
  
-Pro účely anotace jsou data přístupná přes repositář SubVersion: +SubVersion repository je umístěna na stroji svn
-  /net/data/SVN_ufal/pedt+  /home/svn/repos/pedt
  
-Vzdálený přístup k repository je (pomocí protokolu ssh)+Vzdálený přístup k repository je: 
-  svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt+  svn://svn.ms.mff.cuni.cz/pedt
  
 +Pro založení lokální pracovní kopie (working copy) použijte příkaz:
 +  svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel>
 +
 +Nikdo kromě programátora a správce dat (do 06/2009 Pepa Toman, od 06/2009 Eva Fučíková) by ale neměl mít žádný důvod mít u sebe working copy celé repository.
 +
 +1) Pro anotátory:
 Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde: Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:
-  svn+ssh://uzivatel@tap.ms.mff.cuni.cz/net/data/SVN_ufal/pedt/data/anotace/XY+  svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY
  
-kde ''XY'' je kód anotátora+kde ''XY'' je kód anotátora.
  
 +2) Pro Silvii a případně další "důležité" lidi:
 +Celá data PEDT (v různém stavu podle aktuální situace) jsou přístupná zde:
 +
 +  svn://svn.ms.mff.cuni.cz/pedt/data/wsj
 +
 +Body 3) a 4) jsou již pro anotátory zbytečné. Jejich potřeba pominula se zavedením balíčkovacího systému v Tredu. Možná se ale ještě někomu hodí.
 +
 +3) Resources pro TrEd (schemata, EngVallex)
 +  svn://svn.ms.mff.cuni.cz/pedt/anotace/resources
 +
 +4) PEDT makra pro TrEd
 +  svn://svn.ms.mff.cuni.cz/pedt/bin/tred_macros/pedt
  
  
 ===== Anotátoři ===== ===== Anotátoři =====
  
- * **JV**: Jana Vejvodová+ * **JV**: [[Jana Šindlerová]]
  * **LM**: Lucie Mladová  * **LM**: Lucie Mladová
- * **AN**: Аня Hедолужко 
  * **SC**: Silvie Cinková  * **SC**: Silvie Cinková
 + * **KC**: Kristýna Čermáková
 + * **KT**: Kristýna Tomšů
 + * **KV**: Kateřina Veselá
 + * **MR**: Magdaléna Rysová
 + * **KE**: Kateřina Veselovská
 + * **MK**: Matěj Korvas
 + * **JM**: Jan Mašek
 + * **KR**: Kateřina Rysová
 + * **JH**: Jan Hajič
 + * **LH**: Lenka Šíková
 + * **EK**: Ema Krejčová
 + * **VD**: Vojta Diatka
 +bývalí anotátoři:
 +* **AN**: Аня Hедолужко
  
 ====== TO-DO ====== ====== TO-DO ======
 [[internal:pedt.TO-DO|Seznam úkolů]] [[internal:pedt.TO-DO|Seznam úkolů]]
 +
 +
 +===== Anotace vybraných jevů =====
 +[[Anotace rematizátorů a konektorů]]

[ Back to the navigation ] [ Back to the content ]