[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:data [2007/05/04 12:24]
hladka
user:hladka:data [2007/05/04 12:52]
hladka
Line 5: Line 5:
 ==== Data ==== ==== Data ====
  
-   varka+   VARKA
       - **Popis dat**       - **Popis dat**
-         vyber 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire+         * 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire
          * seznam souboru {{user:hladka:varka_1_soubory.txt|}}          * seznam souboru {{user:hladka:varka_1_soubory.txt|}}
       - **Anotace ceho**       - **Anotace ceho**
Line 14: Line 14:
          * Lucka          * Lucka
       - **Dokumentace**       - **Dokumentace**
-         clanek Hajicova, Hladka, Kucova.... +         * Hajicova, Hladka, Kucova: An annotated corpus as a test bed for discourse structure analysisIn Proceedings of the Workshop on Constraints in DiscourseNational University of Ireland, Maynooth, Ireland, pp. 82-89, 2006({{user:hladka:salienceirsko06.pdf|}}) 
-   varka+   VARKA
       - **Popis dat**        - **Popis dat** 
-         nahodny vyber 9 souboru z PDT 2.0+         * 9 souboru nahodne vybranych z PDT 2.0
          * seznam souboru {{user:hladka:varka_2_soubory.txt|}}          * seznam souboru {{user:hladka:varka_2_soubory.txt|}}
        - **Anotace ceho**        - **Anotace ceho**
Line 25: Line 25:
       - **Dokumentace**       - **Dokumentace**
          * ...          * ...
-   varka+   VARKA
       - **Popis dat**       - **Popis dat**
          * vyber 15 souboru z PDT 2.0, u kterych jiz bylo rucne anotovane ACV (viz Sarka)          * vyber 15 souboru z PDT 2.0, u kterych jiz bylo rucne anotovane ACV (viz Sarka)
Line 35: Line 35:
       - **Dokumentace**       - **Dokumentace**
          * ...          * ...
 +   - Bonus
 +      - **Popis dat**
 +         * "Dvorak", uryvek se Skvoreckeho (41 vet, {{user:hladka:DvorakSentencesENCZ.pdf|}})
 +         * 'raw' text prosel temito procedurami
 +            * run-it-all ## AUTOMATICKA procedura z PDT 2.0 (tokenizace, tagger, parser, konverze do t-souboru)
 +            * na t-datech zapracovala Jana Vejvodova, Bara Smrckova
 +      - **Anotace ceho**
 +         * tfa
 +         * rozsirena koreference
 +      - **Anotator**
 +         * Sarka
 +         * Lucka
 +      - **Dokumentace**
 +         * ...   
  
 ==== Nastroje ==== ==== Nastroje ====

[ Back to the navigation ] [ Back to the content ]