Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
projekt-anotace-diskurzu [2009/12/08 17:32] bojar prestehovano do vlastniho jmenneho prostoru |
projekt-anotace-diskurzu [2022/01/17 15:43] (current) ufal |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ====== Projekt anotace diskurzu (textových, | ====== Projekt anotace diskurzu (textových, | ||
| - | |||
| - | Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: [[internal: | ||
| - | |||
| Line 24: | Line 21: | ||
| ==== Na projektu se podílejí ==== | ==== Na projektu se podílejí ==== | ||
| - | lingvisticky: | + | lingvisticky: |
| - | technicky: Jirka Mírovský, Petr Pajas, Zdeněk Žabokrtský | + | technicky: Jirka Mírovský |
| anotátoři: | anotátoři: | ||
| - | |||
| - | **HF** Helena Filipová | ||
| - | **JP** Jana Pěnčíková | ||
| - | **JZ** Jana Zdeňková | ||
| **PJ** Pavlína Jínová | **PJ** Pavlína Jínová | ||
| **VP** Veronika Pavlíková | **VP** Veronika Pavlíková | ||
| + | **MR** Magdaléna Rysová | ||
| + | **JZ** Jana Zdeňková | ||
| + | (dříve i **HF** Helena Filipová) | ||
| Line 41: | Line 37: | ||
| - | ==== Podpora projekty ==== | ||
| - | GAČR Evy Hajičové a Šárky Zikánové (od r. 2009) | ||
| - | GAUKy (od r. 2009): | ||
| - | 3letý GAUK LM na anotaci konektorů | ||
| - | 2letý GAUK ZB na sémantiku synsémantik (na FF) | ||
| - | Možnost mezinárodní spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank | ||
| - | ==== Anotační poznámky | + | ==== Průběh projektu |
| - | **[[projekt-anotace-diskurzu: | + | |
| - | nové poznámky píšeme vždy nahoru, staré nemažeme | + | |
| + | [[projekt-anotace-diskurzu: | ||
| + | ==== VŠE K ANOTACI ==== | ||
| - | ==== Zápisy ze schůzek ==== | + | [[:internal:projekt-anotace-diskurzu:index|Interní poznámky]] pouze pro přihlášené |
| - | podklady pro schůzku 11-02-2008{{internal:podklady_11-2-2008.pdf|}} | + | |
| - | zápis-18-02-2008{{internal:zapis-18-02-2008.pdf|}} | + | |
| - | aktuální plán postupu 20-10-2008{{internal: | + | |
| - | zápis 07-11-2008 {{internal: | + | |
| - | zápis 25-11-2008: výběr konektorů k preanotaci {{internal: | + | |
| - | zápis z 2-12-2008: technické řešení | + | |
| - | zápis z 15-12-2008: technické | + | |
| - | zápis z 30-3-2009 a předchozí: | + | |
| Line 74: | Line 56: | ||
| - | ==== Další | + | |
| - | - Anotace diskurzu v PDT – {{internal: | + | |
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | ==== Různé | ||
| - Odkaz na [[http:// | - Odkaz na [[http:// | ||
| + | - [[instalace_PDTB|Instalace prohlížeče pro Penn Discourse Treebank]] | ||
| - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http:// | - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http:// | ||
| |http:// | |http:// | ||
| - MANUÁL PDTB 2.0 ke stáhnutí {{internal: | - MANUÁL PDTB 2.0 ke stáhnutí {{internal: | ||
| - | - {{internal: | ||
| - Seznamy konektorů od Zuzky: | - Seznamy konektorů od Zuzky: | ||
| {{internal: | {{internal: | ||
| {{internal: | {{internal: | ||
| {{internal: | {{internal: | ||
| - | - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | ||
| - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal: | - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal: | ||
| - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal: | - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal: | ||
| - Základní bibliografie k podklasifikaci textovych vztahů{{internal: | - Základní bibliografie k podklasifikaci textovych vztahů{{internal: | ||
| - | + | ==== Bylo ==== | |
| - | ==== Aktuálně | + | |
| (LM, 2.3.2009) | (LM, 2.3.2009) | ||
| - další úpravy tredu pro anotaci v kontextu discourse | - další úpravy tredu pro anotaci v kontextu discourse | ||
| Line 113: | Line 105: | ||
| - anotace dialogu pro Companions (Silvie) | - anotace dialogu pro Companions (Silvie) | ||
| - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | ||
| - | |||
| - | ukázka megastromu, stav z března 2008: | ||
| - | {{megastrom2.png|}} | ||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | |||
| - | ==== Rozšíření pro Tred pro anotaci diskurzu ==== | ||
| - | === 20081217 - 20090826 (JM): === | ||
| - | Podpora pro anotaci diskurzu užívá rozšíření Tredu nondeprel (non-dependency relations annotation). | ||
| - | === Jednoduchý návod k instalaci a použití: === | ||
| - | ==Instalace: | ||
| - | Tred instalujte ze stránky http:// | ||
| - | Nainstalujte rozšíření Discourse Annotation (Session -> Manage Extensions) | ||
| - | |||
| - | ==Ovládání zobrazení: | ||
| - | Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami: | ||
| - | **Alt+b** - bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, | ||
| - | **Alt+d** - pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) | ||
| - | **Alt+f** - full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny | ||
| - | |||
| - | Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto: | ||
| - | **Ctrl+b** - přepne zobrazení bridging anafory | ||
| - | **Ctrl+r** - přepne zobrazení gramatické koreference | ||
| - | **Ctrl+t** - přepne zobrazení textové koreference | ||
| - | **Ctrl+d** - přepne zobrazení čistě diskurzních šipek | ||
| - | |||
| - | Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách. | ||
| - | |||
| - | ==Editace diskurzních šipek:== | ||
| - | Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. Existující skupinu uzlů je rovněž možno vybrat kliknutím na ni. | ||
| - | **mezera** - přepne označení budoucího cílového uzlu/ | ||
| - | **Ctrl+mezera** - přepne označení u všech uzlů v podstromu aktuálního uzlu (včetně) | ||
| - | **f** (forget) - ruční zapomenutí všech označených uzlů a skupin | ||
| - | **d** (discourse) - vloží diskurzní šipku (šipky) z aktuální skupiny či aktuálního uzlu do zapamatovaného uzlu či skupiny (či zapamatovaných uzlů a skupin); zobrazí se dialogové okno pro vložení typu, který je v případě více cílů společný | ||
| - | **c** (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
| - | **r** (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
| - | **x** - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
| - | **n** - nastavení označených (pomocí mezery) uzlů jako konektorů diskurzní šipky vedoucí z aktuálního uzlu; pokud z akt. uzlu vede více šipek, uživatel je požádán o vybrání té správné; konektor (povrchové vyjádření) se pak zobrazí v bublině, když se myš na chvíli zastaví nad příslušnou šipkou | ||
| - | |||
| - | |||
| - | ==Práce se skupinami uzlů:== | ||
| - | Uzly i z různých stromů je možno seskupovat, diskurzní šipky je možno vést jak mezi jednotlivými uzly, tak mezi skupinami, či kombinovaně - to je reprezentováno diskurzní šipkou vedoucí z/do reprezentujícího uzlu skupiny. Reprezentující uzel skupiny se určí takto: | ||
| - | - v případě, že skupinu tvoří uzly z více stromů, reprezentující uzel skupiny je vždy v nejlevějším stromě | ||
| - | - při rozhodování mezi uzly z jednoho stromu je reprezentující uzel první v průchodu do hloubky | ||
| - | **g** (group) - vytvoří skupinu z označených uzlů | ||
| - | **Ctrl+g** - zruší vybranou skupinu | ||
| - | Šipky, které končí či začínají ve skupině uzlů, opticky i datově končí či začínají v reprezentujících uzlech skupin. | ||
| - | V datech je to reprezentováno atributy start_group_id a target_group_id u diskurzní šipky. | ||
| - | |||
| - | ==Ostatní: | ||
| - | **Ctrl+c** (comment) - vložení diskurzního komentáře k celému uzlu (bez ohledu na šipky) | ||
| - | **Ctrl+k** (asi ' | ||
| - | **u** (' | ||
| - | **h** (is_' | ||
| - | **l** (is_' | ||
| - | |||
| - | |||
| - | ==== Interní poznámky | + | ==== Rozšíření TrEdu pro anotaci diskurzu |
| - | [[:internal:projekt-anotace-diskurzu: | + | Tred používá k anotaci diskurzu rozšíření, |
| + | [[projekt-anotace-diskurzu: | ||
| ==== Bibliografie k diskurzu ==== | ==== Bibliografie k diskurzu ==== | ||
