[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
projekt-anotace-diskurzu [2009/03/26 11:32]
ufal
projekt-anotace-diskurzu [2009/05/21 15:18]
mirovsky
Line 16: Line 16:
 - propojení přímé řeči o více větách (stromech) - propojení přímé řeči o více větách (stromech)
 - spojení všech parcelací  - spojení všech parcelací 
 +
  
  
Line 22: Line 23:
  
 lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová lingvisticky: prof. E. Hajičová, Šárka Zikánová, Lucie Mladová, Zuzka Bedřichová
-technicky: Zdeněk Žabokrtský, Jirka Mírovský, Pavel Češka+technicky: Zdeněk Žabokrtský, Jirka Mírovský, Petr Pajas, Pavel Češka
  
 ==== Zadané práce ==== ==== Zadané práce ====
Line 28: Line 29:
  
  
-==== Plánovaná podpora projekty ==== 
-Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové 
-Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank 
  
-Zadané návrhy na granty (všechny nové): +==== Podpora projekty ==== 
-GAUKy :+GAČR Evy Hajičové a Šárky Zikánové (od r. 2009
 +GAUKy (od r. 2009):
 3letý GAUK LM na anotaci konektorů 3letý GAUK LM na anotaci konektorů
 2letý GAUK ZB na sémantiku synsémantik (na FF) 2letý GAUK ZB na sémantiku synsémantik (na FF)
-1letý GAUK Pavla Češky na technickou podporu anotace diskurzu 
  
 +Možnost mezinárodní spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank
  
  
Line 45: Line 44:
 **[[projekt-anotace-diskurzu:komentare|ZDE]]** shromažďujeme všechny komentáře k prvním pokusným anotacím v TrEdu, context discourse, **[[projekt-anotace-diskurzu:komentare|ZDE]]** shromažďujeme všechny komentáře k prvním pokusným anotacím v TrEdu, context discourse,
 nové poznámky píšeme vždy nahoru, staré nemažeme nové poznámky píšeme vždy nahoru, staré nemažeme
 +
  
 ==== Zápisy ze schůzek ==== ==== Zápisy ze schůzek ====
Line 54: Line 54:
 zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}}
 zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}} zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}}
 +zápis z 30-3-2009 a předchozí: {{zapis_30_3_09.doc|}}
 +
 +
  
  
Line 61: Line 64:
 - Anotace diskurzu v PDT  – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ - Anotace diskurzu v PDT  – {{anotace-diskurzu.ppt|prezentace}} pro pondělní seminář ÚFALu 26.11. 2007, ŠZ
 - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]] - Odkaz na  [[http://www.seas.upenn.edu/~pdtb/|Penn Discourse Treebank 2.0]]
 +- Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http://people.csail.mit.edu/regina/6892/
 +|http://people.csail.mit.edu/regina/6892/]]
 - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}}
 - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH
Line 115: Line 120:
 ukázka megastromu, stav z března 2008:  ukázka megastromu, stav z března 2008: 
 {{megastrom2.png|}} {{megastrom2.png|}}
 +
 +
 +
 +
 +
 +
  
  
 ==== Rozšíření pro Tred pro anotaci diskurzu ==== ==== Rozšíření pro Tred pro anotaci diskurzu ====
-=== 20081217 (JM): ===+=== 20081217 - 20090521 (JM): ===
 Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Původní záměr byl, že se budou nadále vyvíjet jako jedno rozšíření, ale to se nepotvrdilo. Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Původní záměr byl, že se budou nadále vyvíjet jako jedno rozšíření, ale to se nepotvrdilo.
 === Jednoduchý návod k instalaci a použití: === === Jednoduchý návod k instalaci a použití: ===
Line 127: Line 138:
 ==Ovládání zobrazení:== ==Ovládání zobrazení:==
 Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami: Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami:
-Alt+bbridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, bridging +**Alt+b** - bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, bridging 
-Alt+dpure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) +**Alt+d** - pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) 
-Alt+ffull discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny+**Alt+f** - full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny
  
 Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto: Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto:
-Ctrl+bpřepne zobrazení bridging anafory +**Ctrl+b** - přepne zobrazení bridging anafory 
-Ctrl+g: přepne zobrazení gramatické koreference +**Ctrl+r** - přepne zobrazení gramatické koreference 
-Ctrl+tpřepne zobrazení textové koreference +**Ctrl+t** - přepne zobrazení textové koreference 
-Ctrl+dpřepne zobrazení čistě diskurzních šipek+**Ctrl+d** - přepne zobrazení čistě diskurzních šipek
  
 Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách. Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách.
Line 141: Line 152:
 ==Editace diskurzních šipek:== ==Editace diskurzních šipek:==
 Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách.
-mezera - označí budoucí cílový uzel diskurzní šipky +**mezera** přepne označení budoucího cílového uzlu diskurzní šipky; možno postupně vybrat více uzlů; používá se též pro výběr uzlů pro vytvoření skupiny 
-f (forget) - ruční zapomenutí dříve označeného cílového uzlu (není nutné takto ručně zapomínat) +**Ctrl+mezera** - přepne označení u všech uzlů v podstromu aktuálního uzlu (včetně) 
-d (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu +**f** (forget) - ruční zapomenutí všech označených uzlů 
-c (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +**d** (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu 
-r (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +**c** (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky 
-x - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky +**r** (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky 
-Pro úplnostt vloží textovou koreferencib vloží bridging anaforu+**x** - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky 
 + 
 +==Práce se skupinami uzlů:== 
 +Uzly i z různých stromů je možno seskupovat, diskurzní šipky je možno vést jak mezi jednotlivými uzly, tak mezi skupinami, či kombinovaně - to je reprezentováno diskurzní šipkou vedoucí z/do reprezentujícího uzlu skupiny. Reprezentující uzel skupiny se určí takto: 
 +- v případě, že skupinu tvoří uzly z více stromů, reprezentující uzel skupiny je vždy v nejlevějším stromě 
 +- při rozhodování mezi uzly z jednoho stromu je reprezentující uzel první v průchodu do hloubky 
 +**g** (group) - vytvoří skupinu z označených uzlů 
 +**Ctrl+g** - zruší první skupinu, jejíž prvkem je aktuální uzel 
 +V případě, že začátek a/nebo konec šipky je v reprezentujícím uzlu nějaké skupiny, tento začátek a/nebo konec šipky se vztahuje k celé skupině. V datech je to reprezentováno atributy start_group_id a target_group_id u diskurzní šipky. 
 + 
 +==Ostatní:== 
 +**Ctrl+c** (comment) - vložení diskurzního komentáře k celému uzlu (bez ohledu na šipky) 
 +**Ctrl+k** (asi 'k'olaps) - přepne kolapsované zobrazení uzlů
  
  

[ Back to the navigation ] [ Back to the content ]