[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
projekt-anotace-diskurzu [2009/12/08 18:09]
mladova
projekt-anotace-diskurzu [2022/01/17 15:43] (current)
ufal
Line 1: Line 1:
 ====== Projekt anotace diskurzu (textových, promluvových vztahů)====== ====== Projekt anotace diskurzu (textových, promluvových vztahů)======
- 
-Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: [[internal:pdt25:navrhy]] 
- 
  
  
Line 24: Line 21:
 ==== Na projektu se podílejí ====   ==== Na projektu se podílejí ====  
  
-lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová +lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Pavlína Jínová (dříve i Zuzanna Bedřichová) 
-technicky: Jirka MírovskýPetr Pajas, Zdeněk Žabokrtský+technicky: Jirka Mírovský (dříve i Petr Pajas, Zdeněk Žabokrtský)
  
 anotátoři: anotátoři:
  
- 
-**HF** Helena Filipová 
-**JP** Jana Pěnčíková 
-**JZ** Jana Zdeňková 
 **PJ** Pavlína Jínová **PJ** Pavlína Jínová
 **VP** Veronika Pavlíková **VP** Veronika Pavlíková
 +**MR** Magdaléna Rysová
 +**JZ** Jana Zdeňková
 +(dříve i **HF** Helena Filipová)
  
  
Line 45: Line 41:
  
  
 +
 +==== Průběh projektu ====
 +
 +[[projekt-anotace-diskurzu:prubeh|Průběh projektu]] na samostatné stránce
  
 ==== VŠE K ANOTACI ==== ==== VŠE K ANOTACI ====
Line 58: Line 58:
  
  
-==== Zápisy ze schůzek ==== 
-podklady pro schůzku 11-02-2008{{internal:podklady_11-2-2008.pdf|}} 
-zápis-18-02-2008{{internal:zapis-18-02-2008.pdf|}} 
-aktuální plán postupu 20-10-2008{{internal:diskurz-plan-1-.doc|}} 
-zápis 07-11-2008 {{internal:zapis-07-11-2008.doc|}} 
-zápis 25-11-2008: výběr konektorů k preanotaci {{internal:25-11-2008.doc|}} 
-zápis z 2-12-2008: technické řešení diskurzu {{internal:technicke-reseni-diskurzu-2-.doc|}} 
-zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{internal:zapis-15-12-2008.doc|}} 
-zápis z 30-3-2009 a předchozí: {{internal:zapis_30_3_09.doc|}} 
  
  
Line 74: Line 65:
  
  
-==== Další materiály ==== + 
-- Anotace diskurzu v PDT  – {{internal:anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ+ 
 + 
 + 
 +==== Různé materiály ====
 - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]] - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]]
 +- [[instalace_PDTB|Instalace prohlížeče pro Penn Discourse Treebank]]
 - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http://people.csail.mit.edu/regina/6892/ - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http://people.csail.mit.edu/regina/6892/
 |http://people.csail.mit.edu/regina/6892/]] |http://people.csail.mit.edu/regina/6892/]]
 - MANUÁL PDTB 2.0 ke stáhnutí {{internal:pdtb-annotation-manual.pdf|manual_PDTB_2}} - MANUÁL PDTB 2.0 ke stáhnutí {{internal:pdtb-annotation-manual.pdf|manual_PDTB_2}}
-- {{internal:mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{internal:lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH 
 - Seznamy konektorů od Zuzky:  - Seznamy konektorů od Zuzky: 
 {{internal:czech-connectives.xls|české konektory}}  {{internal:czech-connectives.xls|české konektory}} 
 {{internal:czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}}  {{internal:czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} 
 {{internal:konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} {{internal:konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}}
-- Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) 
 - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal:poznamky-k-manualu-pdtb_changed.doc|}} - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal:poznamky-k-manualu-pdtb_changed.doc|}}
 - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal:tahak-typy-vztahu.doc|}} - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal:tahak-typy-vztahu.doc|}}
 - Základní bibliografie k podklasifikaci textovych vztahů{{internal:bibliografie-k-podklasifikaci-textovych-vztahu.doc|}} - Základní bibliografie k podklasifikaci textovych vztahů{{internal:bibliografie-k-podklasifikaci-textovych-vztahu.doc|}}
  
- +==== Bylo ====
-==== Aktuálně ====+
 (LM, 2.3.2009) (LM, 2.3.2009)
 - další úpravy tredu pro anotaci v kontextu discourse - další úpravy tredu pro anotaci v kontextu discourse
Line 115: Line 107:
  
  
 +==== Rozšíření TrEdu pro anotaci diskurzu ====
  
- +Tred používá k anotaci diskurzu rozšíření, jemuž je věnována následující stránka
- +[[projekt-anotace-diskurzu:tred|rozšíření TrEdu "discourse"]]
- +
- +
- +
- +
- +
- +
- +
- +
- +
-==== Rozšíření pro Tred pro anotaci diskurzu ==== +
-=== 20081217 - 20090826 (JM): === +
-Podpora pro anotaci diskurzu užívá rozšíření Tredu nondeprel (non-dependency relations annotation). +
-=== Jednoduchý návod instalaci a použití: === +
-==Instalace:== +
-Tred instalujte ze stránky http://ufal.mff.cuni.cz/~pajas/tred/ +
-Nainstalujte rozšíření Discourse Annotation (Session -> Manage Extensions) +
- +
-==Ovládání zobrazení:== +
-Pro zobrazení větstromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami: +
-**Alt+b** - bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, bridging +
-**Alt+d** - pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) +
-**Alt+f** - full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny +
- +
-Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto: +
-**Ctrl+b** - přepne zobrazení bridging anafory +
-**Ctrl+r** - přepne zobrazení gramatické koreference +
-**Ctrl+t** - přepne zobrazení textové koreference +
-**Ctrl+d** - přepne zobrazení čistě diskurzních šipek +
- +
-Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových tách. +
- +
-==Editace diskurzních šipek:== +
-Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. Existující skupinu uzlů je rovněž možno vybrat kliknutím na ni. +
-**mezera** přepne označení budoucího cílového uzlu/skupiny diskurzní šipky; možno postupně vybrat více uzlů a skupin; používá se též pro výběr uzlů pro vytvoření skupiny +
-**Ctrl+mezera** přepne označení u všech uzlů v podstromu aktuálního uzlu (včetně) +
-**f** (forget) - ruční zapomenutí všech označených uzlů a skupin +
-**d** (discourse) - vloží diskurzní šipku (šipky) z aktuální skupiny či aktuálního uzlu do zapamatovaného uzlu či skupiny (či zapamatovaných uzlů a skupin); zobrazí se dialogové okno pro vložení typu, který je v případě více cílů společný +
-**c** (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +
-**r** (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +
-**x** - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +
-**n** - nastavení označených (pomocí mezery) uzlů jako konektorů diskurzní šipky vedoucí z aktuálního uzlu; pokud z akt. uzlu vede více šipek, uživatel je požádán o vybrání té správné; konektor (povrchové vyjádření) se pak zobrazí v bublině, když se myš na chvíli zastaví nad příslušnou šipkou +
- +
- +
-==Práce se skupinami uzlů:== +
-Uzly i z různých stromů je možno seskupovat, diskurzní šipky je možno vést jak mezi jednotlivými uzly, tak mezi skupinami, či kombinovaně - to je reprezentováno diskurzní šipkou vedoucí z/do reprezentujícího uzlu skupiny. Reprezentující uzel skupiny se určí takto: +
-- v případě, že skupinu tvoří uzly z více stromů, reprezentující uzel skupiny je vždy v nejlevějším stromě +
-- při rozhodování mezi uzly z jednoho stromu je reprezentující uzel první v průchodu do hloubky +
-**g** (group) - vytvoří skupinu z označených uzlů +
-**Ctrl+g** - zruší vybranou skupinu +
-Šipky, které končí či začínají ve skupině uzlů, opticky i datově končí či začínají v reprezentujících uzlech skupin. +
-V datech je to reprezentováno atributy start_group_id a target_group_id u diskurzní šipky. +
- +
-==Ostatní:== +
-**Ctrl+c** (comment) - vložení diskurzního komentáře k celému uzlu (bez ohledu na šipky) +
-**Ctrl+k** (asi 'k'olaps) - přepne kolapsované zobrazení uzlů +
-**u** ('u'nfold) - ručně rozbalí/znovu sbalí aktuální uzel (v kolapsovaném zobrazení uzlů) +
-**h** (is_'h'eading) - přepne vlastnost aktuálního uzlu is_heading +
-**l** (is_'l'ist_entry) - přepne vlastnost aktuálního uzlu is_list_entry +
- +
- +
  
 ==== Bibliografie k diskurzu ==== ==== Bibliografie k diskurzu ====

[ Back to the navigation ] [ Back to the content ]