[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:data [2007/05/04 12:31]
hladka
user:hladka:data [2007/05/04 13:15]
hladka
Line 7: Line 7:
    - VARKA    - VARKA
       - **Popis dat**       - **Popis dat**
-         vyber 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire+         * 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire
          * seznam souboru {{user:hladka:varka_1_soubory.txt|}}          * seznam souboru {{user:hladka:varka_1_soubory.txt|}}
       - **Anotace ceho**       - **Anotace ceho**
Line 17: Line 17:
    - VARKA    - VARKA
       - **Popis dat**        - **Popis dat** 
-         nahodny vyber 9 souboru z PDT 2.0+         * 9 souboru nahodne vybranych z PDT 2.0
          * seznam souboru {{user:hladka:varka_2_soubory.txt|}}          * seznam souboru {{user:hladka:varka_2_soubory.txt|}}
        - **Anotace ceho**        - **Anotace ceho**
Line 35: Line 35:
       - **Dokumentace**       - **Dokumentace**
          * ...          * ...
 +   - Bonus
 +      - **Popis dat**
 +         * "Dvorak", uryvek se Skvoreckeho (41 vet, {{user:hladka:DvorakSentencesENCZ.pdf|}})
 +         * 'raw' text prosel temito procedurami
 +            * run-it-all ## AUTOMATICKA procedura z PDT 2.0 (tokenizace, tagger, parser, konverze do t-souboru)
 +            * na t-datech zapracovala Jana Vejvodova (oprava, doplneni nodetype)
 +      - **Anotace ceho**
 +         * tfc
 +         * rozsirena koreference
 +      - **Anotator**
 +         * Bara Smrckova
 +         * Lucka
 +      - **Dokumentace**
 +         * ...   
  
 ==== Nastroje ==== ==== Nastroje ====

[ Back to the navigation ] [ Back to the content ]