[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Motivace

Dat do poradku vse kolem dat, na kterych se zacala anotovat rozsirena koreference (vzhledem k PDT 2.0) a zacalo se smerovat k bridging anafore. Data, na kterych bylo neco provedeno, jsou rozdelena do tri skupin (rikam jim varky;-). Pro kazdou varku jsou uvedeny udaje, ktere varku jednoznacne charakterizuji. Vsechny soubory, o kterych se pise, mam zatim lokalne u sebe (i kdyz je vlastne asi maji nekteri zainteresovani taky nekde u sebe). Az tuto dokumentaci dokoncim, tak s ni budou seznameni vsichni ti, kteri si informace zde uvedene zaslouzi znat;-))

Data

  1. VARKA
    1. Popis dat
      • 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire
      • seznam souboru varka_1_soubory.txt
    2. Anotace ceho
      • rozsirena koreference
    3. Anotator
      • Lucka
    4. Dokumentace
      • Hajicova, Hladka, Kucova: An annotated corpus as a test bed for discourse structure analysis. In Proceedings of the Workshop on Constraints in Discourse. National University of Ireland, Maynooth, Ireland, pp. 82-89, 2006. (salienceirsko06.pdf)
  2. VARKA
    1. Popis dat
    2. Anotace ceho
      • bridging anafora
    3. Anotator
      • Lucka, predano Anje
    4. Dokumentace
  3. VARKA
    1. Popis dat
      • vyber 15 souboru z PDT 2.0, u kterych jiz bylo rucne anotovane ACV (viz Sarka)
      • seznam souboru varka_3_soubory.txt
    2. Anotace ceho
      • zatim nezpracovano
    3. Anotator
      • nachystano puvodne pro Lucku, predano Anje
    4. Dokumentace
  4. Bonus
    1. Popis dat
      • “Dvorak”, uryvek z Veseleho snu o Dvorakovi J. Skvoreckeho (41 vet, dvoraksentencesencz.pdf)
      • 'raw' text prosel temito procedurami
        • run-it-all ## AUTOMATICKA procedura z PDT 2.0 (tokenizace, tagger, parser, konverze do t-souboru)
        • na t-datech zapracovala Jana Vejvodova (oprava, doplneni nodetype)
    2. Anotace ceho
      • tfc
      • rozsirena koreference
    3. Anotator
      • Bara Smrckova
      • Lucka
    4. Dokumentace

Nastroje

Projektovy adresar

Komu urceno

Eva Hajicova
Bara Hladka
Anja Nedoluzko
Petr Nemec
Pavel Schlesinger
Mirek Tynovsky
Sarka Zikanova


[ Back to the navigation ] [ Back to the content ]