[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
projekt-anotace-diskurzu [2008/12/10 14:26]
anotator
projekt-anotace-diskurzu [2009/05/21 14:49]
mirovsky
Line 1: Line 1:
-====== Projekt anotace diskurzu (mezipropozičních vztahů)======+====== Projekt anotace diskurzu (textových, promluvových vztahů)======
  
-Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https://wiki.ufal.ms.mff.cuni.cz/internal:pdt25:navrhy+Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: [[internal:pdt25:navrhy]]
  
  
Line 16: Line 16:
 - propojení přímé řeči o více větách (stromech) - propojení přímé řeči o více větách (stromech)
 - spojení všech parcelací  - spojení všech parcelací 
 +
  
  
Line 22: Line 23:
  
 lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová
-technicky: Zdeněk Žabokrtský, Jirka Mírovský, Pavel Češka+technicky: Zdeněk Žabokrtský, Jirka Mírovský, Petr Pajas, Pavel Češka
  
 ==== Zadané práce ==== ==== Zadané práce ====
Line 28: Line 29:
  
  
-==== Plánovaná podpora projekty ==== 
-Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové 
-Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank 
  
-Zadané návrhy na granty (všechny nové): +==== Podpora projekty ==== 
-GAUKy :+GAČR Evy Hajičové a Šárky Zikánové (od r. 2009
 +GAUKy (od r. 2009):
 3letý GAUK LM na anotaci konektorů 3letý GAUK LM na anotaci konektorů
 2letý GAUK ZB na sémantiku synsémantik (na FF) 2letý GAUK ZB na sémantiku synsémantik (na FF)
-1letý GAUK Pavla Češky na technickou podporu anotace diskurzu+ 
 +Možnost mezinárodní spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank 
 + 
 + 
 + 
 + 
 +==== Anotační poznámky ==== 
 +**[[projekt-anotace-diskurzu:komentare|ZDE]]** shromažďujeme všechny komentáře k prvním pokusným anotacím v TrEdu, context discourse, 
 +nové poznámky píšeme vždy nahoru, staré nemažeme
  
  
Line 46: Line 53:
 zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}}
 zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}}
 +zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}}
 +zápis z 30-3-2009 a předchozí: {{zapis_30_3_09.doc|}}
 +
 +
 +
 +
  
  
Line 51: Line 64:
 - Anotace diskurzu v PDT  – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ - Anotace diskurzu v PDT  – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ
 - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]] - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]]
 +- Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http://people.csail.mit.edu/regina/6892/
 +|http://people.csail.mit.edu/regina/6892/]]
 - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}}
 - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH
Line 59: Line 74:
 - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky)
 - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}}
 +- Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{tahak-typy-vztahu.doc|}} 
 +- Základní bibliografie k podklasifikaci textovych vztahů{{bibliografie-k-podklasifikaci-textovych-vztahu.doc|}}
  
 ==== Aktuálně ==== ==== Aktuálně ====
-domyslet technické řešení anotace diskurzu +(LM, 2.3.2009) 
-- převést to do TrEdu+další úpravy tredu pro anotaci v kontextu discourse 
 +- úpravy setu sémantických textových vztahů 
 +- první cvičná data pro měření shody 
 +- pondělní seminář 9.3. - přehled nejnovější práce 
 + 
 +(LM, 5.1.2009) 
 +- první verze tredího kontextu discourse se zabíhá a zkouší 
 +- konverze dat pro anotaci
 - oanotovat vybrané konektory:  - oanotovat vybrané konektory: 
 **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž,  **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, 
Line 71: Line 94:
 - první zkoumaná skupina vztahů (z PDTB): **contingency** - první zkoumaná skupina vztahů (z PDTB): **contingency**
  
-**navržená tabulka vlastností konektorů pro anotaci:**+==== Anotační tabulka ==== 
 + 
 +** navržená tabulka vlastností vztahů a konektorů pro anotaci + anotační zkratky v tabulce:** 
 + 
 +**1. typ vztahu** (r: sarciny zkratky* //komentar bez diakritiky//) (hvězdička odděluje formalizovanou a volnou část komentáře) 
 +**2. rozsah argumentů** (1: PAR* //nespojita vsuvka s RHEM//) 
 +**3. konektor** (pokud je v textu) 
 + 
 + nahraditelnost (**nahr:** jakým slovem, s diakritikou!) 
 + vazba na pozici - větná, relativní (**pozice:**) 
 + souvýskyt (s možnými konektory, jiný souvýskyt)(**souv:**) 
 + negace (**neg:**) 
 + morfologické zvláštnosti okolí (**morfg:**) 
 + odkaz do stejného stromu (**ss:**) 
 + ostatní (**etc:**)
  
-  - typ vztahu 
-  - nahraditelnost 
-  - vazba na pozici (větná, relativní) 
-  - souvýskyt (s možnými konektory, jiný souvýskyt) 
-  - negace 
-  - morfologické zvláštnosti okolí 
-  - odkaz do stejného stromu 
-  - ostatní 
  
  
Line 86: Line 115:
 ==== Spolupráce ==== ==== Spolupráce ====
 - výrazná spolupráce s anotací rozšířené textové koreference (Anja) - výrazná spolupráce s anotací rozšířené textové koreference (Anja)
-- anotace dialogu pro Companions (Silvie+- anotace dialogu pro Companions (Silvie)
 - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka
  
Line 96: Line 125:
  
  
 +
 +
 +==== Rozšíření pro Tred pro anotaci diskurzu ====
 +=== 20081217 (JM): ===
 +Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Původní záměr byl, že se budou nadále vyvíjet jako jedno rozšíření, ale to se nepotvrdilo.
 +=== Jednoduchý návod k instalaci a použití: ===
 +==Instalace:==
 +Tred instalujte ze stránky http://ufal.mff.cuni.cz/~pajas/tred/
 +Nainstalujte rozšíření Discourse Annotation (Session -> Manage Extensions)
 +
 +==Ovládání zobrazení:==
 +Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami:
 +**Alt+b** - bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, bridging
 +**Alt+d** - pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging)
 +**Alt+f** - full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny
 +
 +Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto:
 +**Ctrl+b** - přepne zobrazení bridging anafory
 +**Ctrl+r** - přepne zobrazení gramatické koreference
 +**Ctrl+t** - přepne zobrazení textové koreference
 +**Ctrl+d** - přepne zobrazení čistě diskurzních šipek
 +
 +Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách.
 +
 +==Editace diskurzních šipek:==
 +Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách.
 +**mezera** - přepne označení budoucího cílového uzlu diskurzní šipky; možno postupně vybrat více uzlů; používá se též pro výběr uzlů pro vytvoření skupiny
 +**Ctrl+mezera** - přepne označení u všech uzlů v podstromu aktuálního uzlu (včetně)
 +**f** (forget) - ruční zapomenutí všech označených uzlů
 +**d** (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu
 +**c** (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky
 +**r** (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky
 +**x** - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky
 +
 +==Práce se skupinami uzlů:==
 +Uzly i z různých stromů je možno seskupovat, diskurzní šipky je možno vést jak mezi jednotlivými uzly, tak mezi skupinami, či kombinovaně - to je reprezentováno diskurzní šipkou vedoucí z/do reprezentujícího uzlu skupiny. Reprezentující uzel skupiny se určí takto:
 +- v případě, že skupinu tvoří uzly z více stromů, reprezentující uzel skupiny je vždy v nejlevějším stromě
 +- při rozhodování mezi uzly z jednoho stromu je reprezentující uzel první v průchodu do hloubky
 +**g** (group) - vytvoří skupinu z označených uzlů
 +**Ctrl+g** - zruší první skupinu, jejíž prvkem je aktuální uzel
 +V případě, že začátek a/nebo konec šipky je v reprezentujícím uzlu nějaké skupiny, tento začátek a/nebo konec šipky se vztahuje k celé skupině. V datech je to reprezentováno atributy start_group_id a target_group_id u diskurzní šipky.
 +
 +==Ostatní:==
 +**Ctrl+c** (comment) - vložení diskurzního komentáře k celému uzlu (bez ohledu na šipky)
 +**Ctrl+k** (asi 'k'olaps) - přepne kolapsované zobrazení uzlů
 +
 +
 +
 +==== Interní poznámky ====
 +
 +[[:internal:projekt-anotace-diskurzu|interní poznámky]] pouze pro přihlášené 
  
  

[ Back to the navigation ] [ Back to the content ]