Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
| projekt-anotace-diskurzu [2009/03/26 11:32] ufal | projekt-anotace-diskurzu [2022/01/17 15:43] (current) ufal | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ====== Projekt anotace diskurzu (textových, | ====== Projekt anotace diskurzu (textových, | ||
| - | |||
| - | Doplňující informace o tomto projektu na stránce Návrhy pro PDT 2.5, tj. zde: [[internal: | ||
| - | |||
| Line 16: | Line 13: | ||
| - propojení přímé řeči o více větách (stromech) | - propojení přímé řeči o více větách (stromech) | ||
| - spojení všech parcelací | - spojení všech parcelací | ||
| + | |||
| + | |||
| + | |||
| Line 21: | Line 21: | ||
| ==== Na projektu se podílejí ==== | ==== Na projektu se podílejí ==== | ||
| - | lingvisticky: | + | lingvisticky: | 
| - | technicky: Zdeněk Žabokrtský, Jirka Mírovský, Pavel Češka | + | technicky: | 
| - | ==== Zadané práce ==== | + | anotátoři: | 
| - | LM + ZB: disertace, (ZB na FF :-)) | + | |
| + | **PJ** Pavlína Jínová | ||
| + | **VP** Veronika Pavlíková | ||
| + | **MR** Magdaléna Rysová | ||
| + | **JZ** Jana Zdeňková | ||
| + | (dříve i **HF** Helena Filipová) | ||
| - | ==== Plánovaná podpora projekty ==== | ||
| - | Přijatý GAČR paní profesorky Hajičové a Šárky Zikánové | ||
| - | Možnost mezinárodního spoluporáce v návaznosti na grant prof. Joshiho a Penn Discourse Treebank | ||
| - | Zadané návrhy na granty (všechny nové): | ||
| - | GAUKy : | ||
| - | 3letý GAUK LM na anotaci konektorů | ||
| - | 2letý GAUK ZB na sémantiku synsémantik (na FF) | ||
| - | 1letý GAUK Pavla Češky na technickou podporu anotace diskurzu | ||
| Line 42: | Line 38: | ||
| - | ==== Anotační poznámky ==== | ||
| - | **[[projekt-anotace-diskurzu: | ||
| - | nové poznámky píšeme vždy nahoru, staré nemažeme | ||
| - | ==== Zápisy ze schůzek ==== | ||
| - | podklady pro schůzku 11-02-2008{{podklady_11-2-2008.pdf|}} | ||
| - | zápis-18-02-2008{{zapis-18-02-2008.pdf|}} | ||
| - | aktuální plán postupu 20-10-2008{{diskurz-plan-1-.doc|}} | ||
| - | zápis 07-11-2008 {{zapis-07-11-2008.doc|}} | ||
| - | zápis 25-11-2008: výběr konektorů k preanotaci {{25-11-2008.doc|}} | ||
| - | zápis z 2-12-2008: technické řešení diskurzu {{technicke-reseni-diskurzu-2-.doc|}} | ||
| - | zápis z 15-12-2008: technické řešení meziprop.diskurzních vztahů II {{zapis-15-12-2008.doc|}} | ||
| + | ==== Průběh projektu ==== | ||
| - | ==== Další materiály | + | [[projekt-anotace-diskurzu: | 
| - | - Anotace diskurzu v PDT  – {{anotace-diskurzu.ppt|prezentace}} | + | |
| + | ==== VŠE K ANOTACI | ||
| + | |||
| + | [[: | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | ==== Různé materiály ==== | ||
| - Odkaz na  [[http:// | - Odkaz na  [[http:// | ||
| - | - MANUÁL PDTB 2.0 ke stáhnutí {{pdtb-annotation-manual.pdf|manual_PDTB_2}} | + | - [[instalace_PDTB|Instalace prohlížeče pro Penn Discourse Treebank]] | 
| - | - {{mladova_zikanova_hajicova_lrec.pdf|Článek}} a {{lm_discourse.pdf|prezentace}} o diskurzu na konferenci LREC 2008, LM, ŠZ, EH | + | - Odkaz na seminář R. Barzilay (MIT, Cambridge, MA) k diskurzu [[http:// | 
| + | |http:// | ||
| + | - MANUÁL PDTB 2.0 ke stáhnutí {{internal:pdtb-annotation-manual.pdf|manual_PDTB_2}} | ||
| - Seznamy konektorů od Zuzky: | - Seznamy konektorů od Zuzky: | ||
| - | {{czech-connectives.xls|české konektory}} | + | {{internal:czech-connectives.xls|české konektory}} | 
| - | {{czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} | + | {{internal:czech-connectives-ceske-poradi-sarka.xls|české konektory abecedně}} | 
| - | {{konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} | + | {{internal:konektory-doplneno-zu.xls|doplněný seznam možných českých konektorů}} | 
| - | - Šárcina prezentace pro mixer 26.11.2008 (na požádání u Šárky) | + | - Zuzčiny poznámky k manuálu PDTB 2.0 {{internal:poznamky-k-manualu-pdtb_changed.doc|}} | 
| - | - Zuzčiny poznámky k manuálu PDTB 2.0 {{poznamky-k-manualu-pdtb_changed.doc|}} | + | - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{internal:tahak-typy-vztahu.doc|}} | 
| - | - Seznam diskurzních vztahů a jejich zkratek (SZ, 29.12.2008) {{tahak-typy-vztahu.doc|}} | + | - Základní bibliografie k podklasifikaci textovych vztahů{{internal:bibliografie-k-podklasifikaci-textovych-vztahu.doc|}} | 
| - | - Základní bibliografie k podklasifikaci textovych vztahů{{bibliografie-k-podklasifikaci-textovych-vztahu.doc|}} | + | |
| - | ==== Aktuálně | + | ==== Bylo ==== | 
| (LM, 2.3.2009) | (LM, 2.3.2009) | ||
| - další úpravy tredu pro anotaci v kontextu discourse | - další úpravy tredu pro anotaci v kontextu discourse | ||
| Line 82: | Line 93: | ||
| - první verze tredího kontextu discourse se zabíhá a zkouší | - první verze tredího kontextu discourse se zabíhá a zkouší | ||
| - konverze dat pro anotaci | - konverze dat pro anotaci | ||
| - | - oanotovat vybrané konektory: | ||
| - | **však, také, naopak, tedy, navíc, ovšem, přesto, jinak, totiž, | ||
| - |  | ||
| - | - první zkoumaný konektor: **přesto** | ||
| - | - první zkoumaná skupina vztahů (z PDTB): **contingency** | ||
| - | ==== Anotační tabulka ==== | ||
| - | ** navržená tabulka vlastností vztahů a konektorů pro anotaci + anotační zkratky v tabulce:** | ||
| - | **1. typ vztahu** (r: sarciny zkratky* //komentar bez diakritiky// | ||
| - | **2. rozsah argumentů** (1: PAR* //nespojita vsuvka s RHEM//) | ||
| - | **3. konektor** (pokud je v textu) | ||
| - | |||
| - |  | ||
| - | vazba na pozici - větná, relativní (**pozice: | ||
| - |  | ||
| - |  | ||
| - |  | ||
| - | odkaz do stejného stromu (**ss:**) | ||
| - |  | ||
| Line 113: | Line 106: | ||
| - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | - technicky: vytvoření anotačního prostředí – pro první hrubý průzkum byl vytvořen na jaře 2008 kontext megatree v TrEdu, (Pepa Toman), dále využijeme nový kontext PLM_T_Bridging v TrEdu, úpravy provedou Jirka Mírovský a Pavel Češka | ||
| - | ukázka megastromu, stav z března 2008: | ||
| - | {{megastrom2.png|}} | ||
| - | |||
| - | |||
| - | ==== Rozšíření pro Tred pro anotaci diskurzu ==== | ||
| - | === 20081217 (JM): === | ||
| - | Prvotní podpora pro anotaci diskurzu vychází z rozšíření pro anotaci bridging anafory. Původní záměr byl, že se budou nadále vyvíjet jako jedno rozšíření, | ||
| - | === Jednoduchý návod k instalaci a použití: === | ||
| - | ==Instalace: | ||
| - | Tred instalujte ze stránky http:// | ||
| - | Nainstalujte rozšíření Discourse Annotation (Session -> Manage Extensions) | ||
| - | |||
| - | ==Ovládání zobrazení: | ||
| - | Pro zobrazení vět, stromů a diskurzních šipek existují tři přednastavené módy, které se přepínají těmito klávesovými zkratkami: | ||
| - | Alt+b: bridging mode - vidět je jeden strom, velké množství kontextových vět vpřed i vzad, šipky: koreference, | ||
| - | Alt+d: pure discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: čistě diskurzní (čili ne koref. a bridging) | ||
| - | Alt+f: full discourse mode - vidět jsou dva stromy vzad a jeden vpřed, deset vět vzad a pět vpřed, šipky: všechny | ||
| - | |||
| - | Zobrazení jednotlivých druhů šipek je možno ovládat nezávisle na přednastaveném módu takto: | ||
| - | Ctrl+b: přepne zobrazení bridging anafory | ||
| - | Ctrl+g: přepne zobrazení gramatické koreference | ||
| - | Ctrl+t: přepne zobrazení textové koreference | ||
| - | Ctrl+d: přepne zobrazení čistě diskurzních šipek | ||
| - | |||
| - | Zobrazení se týká nejen šipek, ale rovněž barevného zvýraznění slov v kontextových větách. | ||
| - | |||
| - | ==Editace diskurzních šipek:== | ||
| - | Aktuální uzel se vybírá kliknutím na uzel ve stromech nebo kliknutím na slovo ve větách. | ||
| - | mezera - označí budoucí cílový uzel diskurzní šipky | ||
| - | f (forget) - ruční zapomenutí dříve označeného cílového uzlu (není nutné takto ručně zapomínat) | ||
| - | d (discourse) - vloží diskurzní šipku z aktuálního uzlu do zapamatovaného uzlu; zobrazí se dialogové okno pro vložení typu | ||
| - | c (comment) - vložení komentáře k diskurzní šipce vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
| - | r (re-type) - změna typu šipky vedoucí z aktuálního uzlu; zobrazí se dialogové okno pro jeho vložení; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
| - | x - smazání šipky vedoucí z aktuálního uzlu; existuje-li více šipek vedoucích z aktuálního uzlu, nejprve se zobrazí okno s jejich seznamem, které umožní výběr té správné šipky | ||
| - | Pro úplnost: t vloží textovou koreferenci, | ||
| - | |||
| - | |||
| - | |||
| - | ==== Interní poznámky ==== | ||
| - | [[: | + | ==== Rozšíření TrEdu pro anotaci diskurzu ==== | 
| + | Tred používá k anotaci diskurzu rozšíření, | ||
| + | [[projekt-anotace-diskurzu: | ||
| ==== Bibliografie k diskurzu ==== | ==== Bibliografie k diskurzu ==== | ||
