[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
projekt-anotace-diskurzu [2009/01/13 11:58]
anotator
projekt-anotace-diskurzu [2009/06/10 10:32]
ptacek dokumentu neverejne na zadost LM
Line 1: Line 1:
-====== Projekt anotace diskurzu (mezipropozičních vztahů)======+====== Projekt anotace diskurzu (textových, promluvových vztahů)======
  
-Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: https://wiki.ufal.ms.mff.cuni.cz/internal:pdt25:navrhy+Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: [[internal:pdt25:navrhy]]
  
  
Line 16: Line 16:
 - propojení přímé řeči o více větách (stromech) - propojení přímé řeči o více větách (stromech)
 - spojení všech parcelací  - spojení všech parcelací 
 +
  
  
Line 22: Line 23:
  
 lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová
-technicky: Zdeněk Žabokrtský, Jirka Mírovský, Pavel Češka+technicky: Zdeněk Žabokrtský, Jirka Mírovský, Petr Pajas, Pavel Češka
  
 ==== Zadané práce ==== ==== Zadané práce ====
Line 28: Line 29:
  
  
-==== Plánovaná podpora projekty ==== 
-Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové 
-Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank 
  
-Zadané návrhy na granty (všechny nové): +==== Podpora projekty ==== 
-GAUKy :+GAČR Evy Hajičové a Šárky Zikánové (od r. 2009
 +GAUKy (od r. 2009):
 3letý GAUK LM na anotaci konektorů 3letý GAUK LM na anotaci konektorů
 2letý GAUK ZB na sémantiku synsémantik (na FF) 2letý GAUK ZB na sémantiku synsémantik (na FF)
-1letý GAUK Pavla Češky na technickou podporu anotace diskurzu+ 
 +Možnost mezinárodní spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank 
  
  
  
 ==== Anotační poznámky ==== ==== Anotační poznámky ====
-[[ZDE]] shromažďujeme všechny komentáře k prvním pokusným anotacím v TrEdu, context discourse,+**[[projekt-anotace-diskurzu:komentare|ZDE]]** shromažďujeme všechny komentáře k prvním pokusným anotacím v TrEdu, context discourse,
 nové poznámky píšeme vždy nahoru, staré nemažeme nové poznámky píšeme vždy nahoru, staré nemažeme
 +
 +
  
 ==== Zápisy ze schůzek ==== ==== Zápisy ze schůzek ====
-podklady pro schůzku 11-02-2008{{podklady_11-2-2008.pdf|}} +podklady pro schůzku 11-02-2008{{internal:podklady_11-2-2008.pdf|}} 
-zápis-18-02-2008{{zapis-18-02-2008.pdf|}} +zápis-18-02-2008{{internal:zapis-18-02-2008.pdf|}} 
-aktuální plán postupu 20-10-2008{{diskurz-plan-1-.doc|}} +aktuální plán postupu 20-10-2008{{internal:diskurz-plan-1-.doc|}} 
-zápis 07-11-2008 {{zapis-07-11-2008.doc|}} +zápis 07-11-2008 {{internal:zapis-07-11-2008.doc|}} 
-zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} +zápis 25-11-2008: výběr konektorů k preanotaci {{internal:25-11-2008.doc|}} 
-zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} +zápis z 2-12-2008: technické řešení diskurzu {{internal:technicke-reseni-diskurzu-2-.doc|}} 
-zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}}+zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{internal:zapis-15-12-2008.doc|}} 
 +zápis z 30-3-2009 a předchozí: {{internal:zapis_30_3_09.doc|}} 
 + 
 + 
 + 
  
  
  
 ==== Další materiály ==== ==== Další materiály ====
-- Anotace diskurzu v PDT  – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ+- Anotace diskurzu v PDT  – {{internal:anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ
 - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]] - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]]
-- MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} +- Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http://people.csail.mit.edu/regina/6892/ 
-- {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH+|http://people.csail.mit.edu/regina/6892/]] 
 +- MANUÁL PDTB 2.0 ke stáhnutí {{internal:pdtb-annotation-manual.pdf|manual_PDTB_2}} 
 +- {{internal:mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{internal:lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH
 - Seznamy konektorů od Zuzky:  - Seznamy konektorů od Zuzky: 
-{{czech-connectives.xls|české konektory}}  +{{internal:czech-connectives.xls|české konektory}}  
-{{czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}}  +{{internal:czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}}  
-{{konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}}+{{internal:konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}}
 - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky)
-- Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} +- Zuzčiny poznámky k manuálu PDTB 2.0 {{internal:poznamky-k-manualu-pdtb_changed.doc|}} 
-- Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{tahak-typy-vztahu.doc|}}+- Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal:tahak-typy-vztahu.doc|}} 
 +- Základní bibliografie k podklasifikaci textovych vztahů{{internal:bibliografie-k-podklasifikaci-textovych-vztahu.doc|}}
  
 ==== Aktuálně ==== ==== Aktuálně ====
 +(LM, 2.3.2009)
 +- další úpravy tredu pro anotaci v kontextu discourse
 +- úpravy setu sémantických textových vztahů
 +- první cvičná data pro měření shody
 +- pondělní seminář 9.3. - přehled nejnovější práce
 +
 (LM, 5.1.2009) (LM, 5.1.2009)
 - první verze tredího kontextu discourse se zabíhá a zkouší - první verze tredího kontextu discourse se zabíhá a zkouší
Line 94: Line 111:
  odkaz do stejného stromu (**ss:**)  odkaz do stejného stromu (**ss:**)
  ostatní (**etc:**)  ostatní (**etc:**)
 +
  
  
Line 99: Line 117:
 ==== Spolupráce ==== ==== Spolupráce ====
 - výrazná spolupráce s anotací rozšířené textové koreference (Anja) - výrazná spolupráce s anotací rozšířené textové koreference (Anja)
-- anotace dialogu pro Companions (Silvie+- anotace dialogu pro Companions (Silvie)
 - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka
  
 ukázka megastromu, stav z března 2008:  ukázka megastromu, stav z března 2008: 
 {{megastrom2.png|}} {{megastrom2.png|}}
 +
 +
 +
 +
 +
 +
 +
  
 ==== Rozšíření pro Tred pro anotaci diskurzu ==== ==== Rozšíření pro Tred pro anotaci diskurzu ====
-=== 20081217 (JM): === +=== 20081217 - 20090521 (JM): === 
-Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Zachovává funkčnost původního rozšířenís tím, +Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Původní záměr byl, že se budou nadále vyvíjet jako jedno rozšíření, ale to se nepotvrdilo.
-že se dále budou možná vyvíjet jako rozšíření jedno.+
 === Jednoduchý návod k instalaci a použití: === === Jednoduchý návod k instalaci a použití: ===
 ==Instalace:== ==Instalace:==
Line 116: Line 140:
 ==Ovládání zobrazení:== ==Ovládání zobrazení:==
 Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami: Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami:
-Alt+bbridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, bridging +**Alt+b** - bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, bridging 
-Alt+dpure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) +**Alt+d** - pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) 
-Alt+ffull discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny+**Alt+f** - full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny
  
 Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto: Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto:
-Ctrl+bpřepne zobrazení bridging anafory +**Ctrl+b** - přepne zobrazení bridging anafory 
-Ctrl+g: přepne zobrazení gramatické koreference +**Ctrl+r** - přepne zobrazení gramatické koreference 
-Ctrl+tpřepne zobrazení textové koreference +**Ctrl+t** - přepne zobrazení textové koreference 
-Ctrl+dpřepne zobrazení čistě diskurzních šipek+**Ctrl+d** - přepne zobrazení čistě diskurzních šipek
  
 Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách. Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách.
Line 130: Line 154:
 ==Editace diskurzních šipek:== ==Editace diskurzních šipek:==
 Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách.
-mezera - označí budoucí cílový uzel diskurzní šipky +**mezera** přepne označení budoucího cílového uzlu diskurzní šipky; možno postupně vybrat více uzlů; používá se též pro výběr uzlů pro vytvoření skupiny 
-f (forget) - ruční zapomenutí dříve označeného cílového uzlu (není nutné takto ručně zapomínat) +**Ctrl+mezera** - přepne označení u všech uzlů v podstromu aktuálního uzlu (včetně) 
-d (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu +**f** (forget) - ruční zapomenutí všech označených uzlů 
-c (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +**d** (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu 
-r (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +**c** (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky 
-x - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +**r** (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky 
-Pro úplnostt vloží textovou koreferencib vloží bridging anaforu+**x** - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky 
 + 
 +==Práce se skupinami uzlů:== 
 +Uzly i z různých stromů je možno seskupovat, diskurzní šipky je možno vést jak mezi jednotlivými uzly, tak mezi skupinami, či kombinovaně - to je reprezentováno diskurzní šipkou vedoucí z/do reprezentujícího uzlu skupiny. Reprezentující uzel skupiny se určí takto: 
 +- v případě, že skupinu tvoří uzly z více stromů, reprezentující uzel skupiny je vždy v nejlevějším stromě 
 +- při rozhodování mezi uzly z jednoho stromu je reprezentující uzel první v průchodu do hloubky 
 +**g** (group) - vytvoří skupinu z označených uzlů 
 +**Ctrl+g** - zruší první skupinu, jejíž prvkem je aktuální uzel 
 +V případě, že začátek a/nebo konec šipky je v reprezentujícím uzlu nějaké skupiny, tento začátek a/nebo konec šipky se vztahuje k celé skupině. V datech je to reprezentováno atributy start_group_id a target_group_id u diskurzní šipky. 
 + 
 +==Ostatní:== 
 +**Ctrl+c** (comment) - vložení diskurzního komentáře k celému uzlu (bez ohledu na šipky) 
 +**Ctrl+k** (asi 'k'olaps) - přepne kolapsované zobrazení uzlů 
 + 
 + 
 + 
 +==== Interní poznámky ==== 
 + 
 +[[:internal:projekt-anotace-diskurzu|interní poznámky]] pouze pro přihlášené  
  
 ==== Bibliografie k diskurzu ==== ==== Bibliografie k diskurzu ====

[ Back to the navigation ] [ Back to the content ]