This is an old revision of the document!
Table of Contents
Motivace
Dat do poradku vse kolem dat, na kterych se zacala anotovat rozsirena koreference (vzhledem k PDT 2.0) a zacalo se smerovat k bridging anafore. Data, na kterych bylo neco provedeno, jsou rozdelena do tri skupin (rikam jim varky;-). Pro kazdou varku jsou uvedeny udaje, ktere varku jednoznacne charakterizuji. Vsechny soubory, o kterych se pise, mam zatim lokalne u sebe (i kdyz je vlastne asi maji nekteri zainteresovani taky nekde u sebe). Az tuto dokumentaci dokoncim, tak s ni budou seznameni vsichni ti, kteri si informace zde uvedene zaslouzi znat;-))
Data
- VARKA
- Popis dat
- vyber 40 souboru z PDT 2.0, ktere byly barevne anotovany na papire
- seznam souboru varka_1_soubory.txt
- Anotace ceho
- rozsirena koreference
- Anotator
- Lucka
- Dokumentace
- Hajicova, Hladka, Kucova: An annotated corpus as a test bed for discourse structure analysis. In Proceedings of the Workshop on Constraints in Discourse. National University of Ireland, Maynooth, Ireland, pp. 82-89, 2006. (salienceirsko06.pdf)
- VARKA
- Popis dat
- nahodny vyber 9 souboru z PDT 2.0
- seznam souboru varka_2_soubory.txt
- Anotace ceho
- bridging anafora
- Anotator
- Lucka, predano Anje
- Dokumentace
- …
- VARKA
- Popis dat
- vyber 15 souboru z PDT 2.0, u kterych jiz bylo rucne anotovane ACV (viz Sarka)
- seznam souboru varka_3_soubory.txt
- Anotace ceho
- zatim nezpracovano
- Anotator
- nachystano puvodne pro Lucku, predano Anje
- Dokumentace
- …
Nastroje
Projektovy adresar
Komu urceno
Eva Hajicova
Bara Hladka
Anja Nedoluzko
Petr Nemec
Pavel Schlesinger
Mirek Tynovsky
Sarka Zikanova
…