[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
external:pedt [2007/06/07 05:45]
toman změna údajů kvůli přechodu na novou repository
external:pedt [2008/11/24 16:54]
anotator
Line 1: Line 1:
 ====== Prague English Dependency Treebank ====== ====== Prague English Dependency Treebank ======
 Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině. Prague English Dependency Treebank je projekt anotace anglických vět Wall Street Journalu na tektogramatické rovině.
 +
 +
 +
 +
 +
 +
  
 ===== Dokumenty ===== ===== Dokumenty =====
Line 8: Line 14:
           * Instalace EngValLex editoru [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.html|HTML]] [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.pdf|PDF]]           * Instalace EngValLex editoru [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.html|HTML]] [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/instalace.pdf|PDF]]
           * Slovník EngValLex (omezený přístup) [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/engvallex.pdf|PDF]]           * Slovník EngValLex (omezený přístup) [[https://blackbird.ms.mff.cuni.cz/semecky/pedt/documents/engvallex.pdf|PDF]]
-          * Functors of attributes governed by all sorts of nouns {{:user:semecky:privlastky-seznam2.doc|privlastky-seznam2.doc}} +          * Functors of attributes governed by all sorts of nouns{{:user:semecky:privlastky-seznam2.doc|privlastky-seznam2.doc}} 
-           * Seznam anotačních maker pro P(E)DT - verze 13. 3. 07 {{:external:nova_makra.doc|nova_makra.doc}} +           * Seznam anotačních maker pro P(E)DT - verze 13. 3. 07, opraveno 25. 2. 2008 {{:external:anotacni_makra.pdf|anotacni_makra.pdf}} 
            * Manuál pro tektogramatickou anotaci angličtiny, 2006 [[http://ufal.mff.cuni.cz/~cinkova/TR_En.pdf|PDF]]            * Manuál pro tektogramatickou anotaci angličtiny, 2006 [[http://ufal.mff.cuni.cz/~cinkova/TR_En.pdf|PDF]]
  
Line 18: Line 24:
           * Prezentace PML pro účely anotace PropBanku a navazujících projektů: [https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]]           * Prezentace PML pro účely anotace PropBanku a navazujících projektů: [https://blackbird.ms.mff.cuni.cz/semecky/pedt/pml.pdf|PDF]]
           * Prezentace "Tectogrammatical Representation of English", PIRE meeting, VMC, 4. 12. 2006, Praha: {{:external:cin_PIRE_VMC.ppt}}            * Prezentace "Tectogrammatical Representation of English", PIRE meeting, VMC, 4. 12. 2006, Praha: {{:external:cin_PIRE_VMC.ppt}} 
-          * Prezentace z manuálového sezení 19.4.2007: {{:external:tectogrammatical-annotation-english.ppt}}  +          * Prezentace z manuálového sezení 19.4.2007: {{:external:tectogrammatical-annotation-english.ppt}} 
- +          * Prezentace "Tectogrammatical Representation of English in PEDT", 3rd PIRE meeting, 6.6.2007, Mertesdorf Německo: {{external:lm_pire2007.ppt}} 
- +          * Prezentace ze schůzky 11. 11.2008: Anotace PREC, RHEM a CM:{{external:anotace-konektoru-rematizatoru-a-cm.pdf|PEDT_discourse_connectives}}
- +
  
 ===== Data ===== ===== Data =====
Line 28: Line 32:
 [[https://blackbird.ms.mff.cuni.cz/toman/pedt/|PEDT data browser]] [[https://blackbird.ms.mff.cuni.cz/toman/pedt/|PEDT data browser]]
  
-Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajícím souborům Wall Street Journalu.+Data jsou rozdělena do 243 sekcí, z nichž každá obsahuje maximálně 10 souborů odpovídajících souborům Wall Street Journalu.
 Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ. Každá sekce je označena třemi číslicemi, které odpovídají prefixům souborů z WSJ.
  
Line 40: Line 44:
   svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel>   svn checkout svn://svn.ms.mff.cuni.cz/pedt --username <uživatel>
  
-Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:+Rozumné je však "checkoutovat" pouze tyto části repository: 
 +1) Data 
 +  svn://svn.ms.mff.cuni.cz/pedt/data/wsj 
 + 
 +2) Resources pro TrEd (schemata, EngVallex) 
 +  svn://svn.ms.mff.cuni.cz/pedt/anotace/resources 
 + 
 +3) PEDT makra pro TrEd 
 +  svn://svn.ms.mff.cuni.cz/pedt/bin/tred_macros/pedt 
 + 
 +4) Každý anotátor má pro sebe vyhrazen podadresář v adresáři data/anotace a anotuje pouze data v tomto adresáři. Adresář je přístupný zde:
   svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY   svn://svn.ms.mff.cuni.cz/pedt/data/anotace/XY
  
-kde ''XY'' je kód anotátora+kde ''XY'' je kód anotátora
 + 
 +5) Soubory pro anotaci discourse_connectives jsou zde (kvuli check-outu): 
 +  svn://svn.ms.mff.cuni.cz/pedt/data/anotace/discourse_connectives/XX 
 + 
 +kde XX je cislo od 00 do 21. 
 + 
  
  
Line 50: Line 71:
 ===== Anotátoři ===== ===== Anotátoři =====
  
- * **JV**: Jana Vejvodová+ * **JV**: [[Jana Šindlerová]]
  * **LM**: Lucie Mladová  * **LM**: Lucie Mladová
- * **AN**: Аня Hедолужко 
  * **SC**: Silvie Cinková  * **SC**: Silvie Cinková
  * **KC**: Kristýna Čermáková  * **KC**: Kristýna Čermáková
 + * **KT**: Kristýna Tomšů
 + * **KV**: Kateřina Veselá
 + * **MR**: Magdaléna Rysová
 + * **KE**: Kateřina Veselovská
 + * **MK**: Matěj Korvas
 + * **JM**: Jan Mašek
 +
 +bývalí anotátoři:
 +* **AN**: Аня Hедолужко
  
 ====== TO-DO ====== ====== TO-DO ======
 [[internal:pedt.TO-DO|Seznam úkolů]] [[internal:pedt.TO-DO|Seznam úkolů]]
 +
 +
 +===== Anotace vybraných jevů =====
 +[[Anotace rematizátorů a konektorů]]

[ Back to the navigation ] [ Back to the content ]