[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
projekt-anotace-diskurzu [2008/12/17 18:49]
ufal
projekt-anotace-diskurzu [2022/01/17 15:43] (current)
ufal
Line 1: Line 1:
-====== Projekt anotace diskurzu (mezipropozičních vztahů)====== +====== Projekt anotace diskurzu (textových, promluvových vztahů)======
- +
-Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https://wiki.ufal.ms.mff.cuni.cz/internal:pdt25:navrhy +
  
  
Line 16: Line 13:
 - propojení přímé řeči o více větách (stromech) - propojení přímé řeči o více větách (stromech)
 - spojení všech parcelací  - spojení všech parcelací 
 +
 +
 +
  
  
Line 21: Line 21:
 ==== Na projektu se podílejí ====   ==== Na projektu se podílejí ====  
  
-lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová +lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Pavlína Jínová (dříve i Zuzanna Bedřichová) 
-technicky: Zdeněk Žabokrtský, Jirka Mírovský, Pavel Češka+technicky: Jirka Mírovský (dříve i Petr Pajas, Zdeněk Žabokrtský)
  
-==== Zadané práce ==== +anotátoři:
- LM + ZBdisertace, (ZB na FF :-))+
  
 +**PJ** Pavlína Jínová
 +**VP** Veronika Pavlíková
 +**MR** Magdaléna Rysová
 +**JZ** Jana Zdeňková
 +(dříve i **HF** Helena Filipová)
  
-==== Plánovaná podpora projekty ==== 
-Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové 
-Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank 
  
-Zadané návrhy na granty (všechny nové): 
-GAUKy : 
-3letý GAUK LM na anotaci konektorů 
-2letý GAUK ZB na sémantiku synsémantik (na FF) 
-1letý GAUK Pavla Češky na technickou podporu anotace diskurzu 
  
-==== Zápisy ze schůzek ==== 
-podklady pro schůzku 11-02-2008{{podklady_11-2-2008.pdf|}} 
-zápis-18-02-2008{{zapis-18-02-2008.pdf|}} 
-aktuální plán postupu 20-10-2008{{diskurz-plan-1-.doc|}} 
-zápis 07-11-2008 {{zapis-07-11-2008.doc|}} 
-zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} 
-zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} 
-zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}} 
  
-==== Další materiály ==== + 
-Anotace diskurzu v PDT  – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ+ 
 + 
 + 
 + 
 + 
 + 
 +==== Průběh projektu ==== 
 + 
 +[[projekt-anotace-diskurzu:prubeh|Průběh projektu]] na samostatné stránce 
 + 
 +==== VŠE K ANOTACI ==== 
 + 
 +[[:internal:projekt-anotace-diskurzu:index|Interní poznámky]] pouze pro přihlášené 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 + 
 +==== Různé materiály ====
 - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]] - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]]
-- MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} +- [[instalace_PDTB|Instalace prohlížeče pro Penn Discourse Treebank]] 
-- {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH+- Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http://people.csail.mit.edu/regina/6892/ 
 +|http://people.csail.mit.edu/regina/6892/]] 
 +- MANUÁL PDTB 2.0 ke stáhnutí {{internal:pdtb-annotation-manual.pdf|manual_PDTB_2}}
 - Seznamy konektorů od Zuzky:  - Seznamy konektorů od Zuzky: 
-{{czech-connectives.xls|české konektory}}  +{{internal:czech-connectives.xls|české konektory}}  
-{{czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}}  +{{internal:czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}}  
-{{konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} +{{internal:konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} 
-- Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) +- Zuzčiny poznámky k manuálu PDTB 2.0 {{internal:poznamky-k-manualu-pdtb_changed.doc|}} 
-- Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}}+- Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal:tahak-typy-vztahu.doc|}} 
 +- Základní bibliografie k podklasifikaci textovych vztahů{{internal:bibliografie-k-podklasifikaci-textovych-vztahu.doc|}}
  
-==== Aktuálně ==== +==== Bylo ==== 
-domyslet technické ření anotace diskurzu +(LM, 2.3.2009) 
-- převést to do TrEdu +další úpravy tredu pro anotaci v kontextu discourse 
-- oanotovat vybrané konektory:  +- úpravy setu sémantických textových vztahů 
-**všaktaké, naopak, tedy, navíc, ovšem, přesto, jinak, totiž,  +- první cvičná data pro měření shody 
-   nicméně, konkrétně, například, vlastně, vždyť, zatímco**+- pondělní seminář 9.3. - přehled nejnovější práce 
 + 
 +(LM5.1.2009) 
 +- první verze tredího kontextu discourse se zabíhá a zkouší 
 +- konverze dat pro anotaci
  
-- první zkoumaný konektor: **přesto** 
-- první zkoumaná skupina vztahů (z PDTB): **contingency** 
  
-**- navržená tabulka vlastností vztahů a konektorů pro anotaci:** 
  
-**1. typ vztahu (r: sarciny zkratky* komentar bez diakritiky) 
-  2. rozsah argumentů (1: PAR* nespojita vsuvka s RHEM) 
-  3. konektor (pokud je v textu)** 
  
  
- nahraditelnost (nahr: jakým slovem, s diakritikou!) 
- vazba na pozici - větná, relativní (pozice:) 
- souvýskyt (s možnými konektory, jiný souvýskyt)(souv:) 
- negace (neg:) 
- morfologické zvláštnosti okolí (morfg:) 
- odkaz do stejného stromu (ss:) 
- ostatní (etc:) 
  
  
Line 88: Line 103:
 ==== Spolupráce ==== ==== Spolupráce ====
 - výrazná spolupráce s anotací rozšířené textové koreference (Anja) - výrazná spolupráce s anotací rozšířené textové koreference (Anja)
-- anotace dialogu pro Companions (Silvie+- anotace dialogu pro Companions (Silvie)
 - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka
  
-ukázka megastromu, stav z března 2008:  
-{{megastrom2.png|}} 
- 
-==== Rozšíření pro Tred pro anotaci diskurzu ==== 
-=== 20081217 (JM): === 
-Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Zachovává funkčnost původního rozšíření, s tím, 
-že se dále budou možná vyvíjet jako rozšíření jedno. 
-=== Jednoduchý návod k instalaci a použití: === 
-==Instalace:== 
-Tred instalujte ze stránky http://ufal.mff.cuni.cz/~pajas/tred/ 
-Nainstalujte rozšíření Discourse Annotation (Session -> Manage Extensions) 
- 
-==Ovládání zobrazení:== 
-Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami: 
-Alt+b: bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, bridging 
-Alt+d: pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) 
-Alt+f: full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny 
- 
-Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto: 
-Ctrl+b: přepne zobrazení bridging anafory 
-Ctrl+g: přepne zobrazení gramatické koreference 
-Ctrl+t: přepne zobrazení textové koreference 
-Ctrl+d: přepne zobrazení čistě diskurzních šipek 
  
-Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách.+==== Rozšíření TrEdu pro anotaci diskurzu ====
  
-==Editace diskurzních šipek:== +Tred používá k anotaci diskurzu rozšíření, jemuž je věnována následující stránka: 
-Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. +[[projekt-anotace-diskurzu:tred|rozšíření TrEdu "discourse"]]
-mezera - označí budoucí cílový uzel diskurzní šipky +
-f (forget) - ruční zapomenutí dříve označeného cílového uzlu (není nutné takto ručně zapomínat) +
-d (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu +
-c (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamemkteré umožní výběr té správné šipky +
-r (re-type) změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +
-x - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +
-Pro úplnost: t vloží textovou koreferenci, b vloží bridging anaforu+
  
 ==== Bibliografie k diskurzu ==== ==== Bibliografie k diskurzu ====

[ Back to the navigation ] [ Back to the content ]