[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
projekt-anotace-diskurzu:prubeh [2013/12/09 17:58]
ufal created
projekt-anotace-diskurzu:prubeh [2014/01/07 16:23] (current)
ufal
Line 1: Line 1:
 ===== Průběh projektu ===== ===== Průběh projektu =====
 +==== 2013 ====
 +- zkoumání koreference určitých a neurčitých jmenných frází v ČJ A AJ
 +- zkoumání obecnosti vs. specifičnosti jmenných frází vzhledem ke koreferenci
 +- aplikace vztahu anglických a českých zájmen do systému strojového překladu TectoMT
 +
 +- zkoumání subjektivního pořádku slov na ČJ, AJ a NJ
 +- zkoumání hypotézy systémového uspořádání v kontextově nezapojených větných členech v ČJ a NJ
 +
 +- upřesnění instrukcí pro anotaci aktuálního členění věty v AJ
 +- vytvoření anotačního nástroje pro aktuální členění věty v AJ
 +- anotace aktuálního členění v 5 tis. vět na obou jazykových stranách Pražského česko-anglického závislostního korpusu (PCEDT); pro oba jazyky byla vytvořena a použita částečná automatická předanotace; její úspěšnost byla (prozatím) vyhodnocena na české části dat
 +
 +- vytvoření seznamu alternativních vyjádření diskurzních vztahů, vyhledání jejich výskytů v Pražském diskurzním korpusu (PDiT), formulace anotačních zásad a začátek anotace takto vyjádřených diskurzních vztahů v PDiT
 +
 +- využití aktivovanosti v automatickém určování topicu věty; použito v pravděpodobnostní metodě Latent Dirichlet Allocation na datech PDT
 +
 +- příprava anotace diskurních hranic v textu, tj. hranic vět bez jakéhokoliv diskurzního vztahu (tzv. NoRely)
 +
 +- začátek anotace jmenné koreference v PCEDT
 +- analýza výhody práce nad tektogramatickými stromy v anotaci koreference a asociační anafory
 +- konečná analýza mezianotátorské neshody v anotaci koreference v ČJ
 +- popis hypotaktických konstrukcí (konstrukce s podřadicí spojkou s "elaborativními" významy) v češtině a angličtině
 +- experiment s využitím překladu diskurzních konektorů ve strojovém překladu z AJ do ČJ
 +
 ==== 2012 ==== ==== 2012 ====
-=== 1) === 
 - transformace diskurzních a anaforických dat anotovaných v datech PDT 2.0 do dat PDT 2.5, kontrola konzistence - transformace diskurzních a anaforických dat anotovaných v datech PDT 2.0 do dat PDT 2.5, kontrola konzistence
 - revize diskurní anotace u vztahů specification, explication, generalization a exemplification, revize seznamů - revize diskurní anotace u vztahů specification, explication, generalization a exemplification, revize seznamů
-- dokončení poloautomatické anotace vnitrovětných vztahů, jejich kontrola a opravy 
 - vydání PDiT 1.0 (Prague Discourse Treebank 1.0) - vydání PDiT 1.0 (Prague Discourse Treebank 1.0)
 - vydání technické zprávy Manual for Annotation of Discourse Relations in the PDT - vydání technické zprávy Manual for Annotation of Discourse Relations in the PDT
-=== 2) ===+ 
 +- prvotní srovnání anotace PDiT a PDTB; srovnání mezianotátorské shody, problémových případů 
 +- workshop ve Filadelfii zabývající se různými taxonomiemi v různých diskurzních projektech 
 + 
 +- pracovní verze anotačních pokynů pro anotaci aktuálního členění v angličtině 
 +- studium vybraných jevů v kontextově zapojené a nezapojené části věty 
 + 
 +- poloautomatická anotace vnitrovětných vztahů, jejich kontrola a opravy 
 +- studium diskurzního vztahu příčiny 
 + 
 +- studium vztahu pořadí slov, kontextové nezapojenosti a neurčitého členu v angličtině 
 + 
 +- aplikace procedury pro automatickou anotaci aktivovanosti větných prvků na data PDT; studium výsledných grafů 
 + 
 +- implementace jazykové hry PlayCoref pro iOS 

[ Back to the navigation ] [ Back to the content ]