[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:data [2007/05/04 09:35]
hladka
user:hladka:data [2007/05/07 18:37]
hladka
Line 5: Line 5:
 ==== Data ==== ==== Data ====
  
-   varka+   VARKA
       - **Popis dat**       - **Popis dat**
-         vyber 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire+         * 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire 
 +         * seznam souboru {{user:hladka:varka_1_soubory.txt|}} 
 +         * schema pro t-soubory: ''tdata-schema-bh.xml''
       - **Anotace ceho**       - **Anotace ceho**
          * rozsirena koreference          * rozsirena koreference
Line 13: Line 15:
          * Lucka          * Lucka
       - **Dokumentace**       - **Dokumentace**
-         clanek Hajicova, Hladka, Kucova.... +         * Hajicova, Hladka, Kucova: An annotated corpus as a test bed for discourse structure analysisIn Proceedings of the Workshop on Constraints in DiscourseNational University of Ireland, Maynooth, Ireland, pp. 82-89, 2006({{user:hladka:salienceirsko06.pdf|}}) 
-   varka+   VARKA
       - **Popis dat**        - **Popis dat** 
-         nahodny vyber 9 souboru z PDT 2.0 +         * 9 souboru nahodne vybranych z PDT 2.0 
-      cmpr9410_028.t.gz +         seznam souboru {{user:hladka:varka_2_soubory.txt|}} 
-      cmpr9413_006.t.gz +         schema pro t-soubory: ''tdata-schema-bridging.xml'' 
-      * lnd94103_087.t.gz +       - **Anotace ceho** 
-      * ln94204_107.t.gz +         * bridging anafora
-      * ln94207_76.t.gz +
-      * ln94207_84.t.gz +
-      * ln94208_11.t.gz +
-      * ln94210_95.t.gz +
-      * ln95047_061.t.gz +
-      - **Anotace ceho** +
-         * bridging+
       - **Anotator**       - **Anotator**
          * Lucka, predano Anje          * Lucka, predano Anje
       - **Dokumentace**       - **Dokumentace**
          * ...          * ...
-   varka+   VARKA
       - **Popis dat**       - **Popis dat**
          * vyber 15 souboru z PDT 2.0, u kterych jiz bylo rucne anotovane ACV (viz Sarka)          * vyber 15 souboru z PDT 2.0, u kterych jiz bylo rucne anotovane ACV (viz Sarka)
 +         * seznam souboru {{user:hladka:varka_3_soubory.txt|}}
       - **Anotace ceho**       - **Anotace ceho**
          * zatim nezpracovano          * zatim nezpracovano
Line 41: Line 37:
       - **Dokumentace**       - **Dokumentace**
          * ...          * ...
 +   - Bonus
 +      - **Popis dat**
 +         * "Dvorak", uryvek z Veseleho snu o Dvorakovi J. Skvoreckeho (41 vet, {{user:hladka:DvorakSentencesENCZ.pdf|}})
 +         * 'raw' text prosel temito procedurami
 +            * run-it-all ## AUTOMATICKA procedura z PDT 2.0 (tokenizace, tagger, parser, konverze do t-souboru)
 +            * na t-datech zapracovala Jana Vejvodova (oprava, doplneni nodetype)
 +      - **Anotace ceho**
 +         * tfc
 +         * rozsirena koreference
 +      - **Anotator**
 +         * Bara Smrckova
 +         * Lucka
 +      - **Dokumentace**
 +         * ...   
  
 ==== Nastroje ==== ==== Nastroje ====
 +
 +   * Ma nekdo nastroj, jak dostat ACV anotaci k uzlum v tektogramatickych stromech?
  
 ==== Projektovy adresar ==== ==== Projektovy adresar ====

[ Back to the navigation ] [ Back to the content ]