[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Table of Contents

Průběh projektu

2013

- zkoumání koreference určitých a neurčitých jmenných frází v ČJ A AJ
- zkoumání obecnosti vs. specifičnosti jmenných frází vzhledem ke koreferenci
- aplikace vztahu anglických a českých zájmen do systému strojového překladu TectoMT

- zkoumání subjektivního pořádku slov na ČJ, AJ a NJ
- zkoumání hypotézy systémového uspořádání v kontextově nezapojených větných členech v ČJ a NJ

- upřesnění instrukcí pro anotaci aktuálního členění věty v AJ
- vytvoření anotačního nástroje pro aktuální členění věty v AJ
- anotace aktuálního členění v 5 tis. vět na obou jazykových stranách Pražského česko-anglického závislostního korpusu (PCEDT); pro oba jazyky byla vytvořena a použita částečná automatická předanotace; její úspěšnost byla (prozatím) vyhodnocena na české části dat

- vytvoření seznamu alternativních vyjádření diskurzních vztahů, vyhledání jejich výskytů v Pražském diskurzním korpusu (PDiT), formulace anotačních zásad a začátek anotace takto vyjádřených diskurzních vztahů v PDiT

- využití aktivovanosti v automatickém určování topicu věty; použito v pravděpodobnostní metodě Latent Dirichlet Allocation na datech PDT

- příprava anotace diskurních hranic v textu, tj. hranic vět bez jakéhokoliv diskurzního vztahu (tzv. NoRely)

- začátek anotace jmenné koreference v PCEDT
- analýza výhody práce nad tektogramatickými stromy v anotaci koreference a asociační anafory
- konečná analýza mezianotátorské neshody v anotaci koreference v ČJ
- popis hypotaktických konstrukcí (konstrukce s podřadicí spojkou s “elaborativními” významy) v češtině a angličtině
- experiment s využitím překladu diskurzních konektorů ve strojovém překladu z AJ do ČJ

2012

- transformace diskurzních a anaforických dat anotovaných v datech PDT 2.0 do dat PDT 2.5, kontrola konzistence
- revize diskurní anotace u vztahů specification, explication, generalization a exemplification, revize seznamů
- vydání PDiT 1.0 (Prague Discourse Treebank 1.0)
- vydání technické zprávy Manual for Annotation of Discourse Relations in the PDT

- prvotní srovnání anotace PDiT a PDTB; srovnání mezianotátorské shody, problémových případů
- workshop ve Filadelfii zabývající se různými taxonomiemi v různých diskurzních projektech

- pracovní verze anotačních pokynů pro anotaci aktuálního členění v angličtině
- studium vybraných jevů v kontextově zapojené a nezapojené části věty

- poloautomatická anotace vnitrovětných vztahů, jejich kontrola a opravy
- studium diskurzního vztahu příčiny

- studium vztahu pořadí slov, kontextové nezapojenosti a neurčitého členu v angličtině

- aplikace procedury pro automatickou anotaci aktivovanosti větných prvků na data PDT; studium výsledných grafů

- implementace jazykové hry PlayCoref pro iOS


[ Back to the navigation ] [ Back to the content ]