Differences
This shows you the differences between two versions of the page.
| Next revision | Previous revision | ||
|
projekt-anotace-diskurzu:prubeh [2013/12/09 17:58] ufal created |
projekt-anotace-diskurzu:prubeh [2014/01/07 16:23] (current) ufal |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ===== Průběh projektu ===== | ===== Průběh projektu ===== | ||
| + | ==== 2013 ==== | ||
| + | - zkoumání koreference určitých a neurčitých jmenných frází v ČJ A AJ | ||
| + | - zkoumání obecnosti vs. specifičnosti jmenných frází vzhledem ke koreferenci | ||
| + | - aplikace vztahu anglických a českých zájmen do systému strojového překladu TectoMT | ||
| + | |||
| + | - zkoumání subjektivního pořádku slov na ČJ, AJ a NJ | ||
| + | - zkoumání hypotézy systémového uspořádání v kontextově nezapojených větných členech v ČJ a NJ | ||
| + | |||
| + | - upřesnění instrukcí pro anotaci aktuálního členění věty v AJ | ||
| + | - vytvoření anotačního nástroje pro aktuální členění věty v AJ | ||
| + | - anotace aktuálního členění v 5 tis. vět na obou jazykových stranách Pražského česko-anglického závislostního korpusu (PCEDT); pro oba jazyky byla vytvořena a použita částečná automatická předanotace; | ||
| + | |||
| + | - vytvoření seznamu alternativních vyjádření diskurzních vztahů, vyhledání jejich výskytů v Pražském diskurzním korpusu (PDiT), formulace anotačních zásad a začátek anotace takto vyjádřených diskurzních vztahů v PDiT | ||
| + | |||
| + | - využití aktivovanosti v automatickém určování topicu věty; použito v pravděpodobnostní metodě Latent Dirichlet Allocation na datech PDT | ||
| + | |||
| + | - příprava anotace diskurních hranic v textu, tj. hranic vět bez jakéhokoliv diskurzního vztahu (tzv. NoRely) | ||
| + | |||
| + | - začátek anotace jmenné koreference v PCEDT | ||
| + | - analýza výhody práce nad tektogramatickými stromy v anotaci koreference a asociační anafory | ||
| + | - konečná analýza mezianotátorské neshody v anotaci koreference v ČJ | ||
| + | - popis hypotaktických konstrukcí (konstrukce s podřadicí spojkou s " | ||
| + | - experiment s využitím překladu diskurzních konektorů ve strojovém překladu z AJ do ČJ | ||
| + | |||
| ==== 2012 ==== | ==== 2012 ==== | ||
| - | === 1) === | ||
| - transformace diskurzních a anaforických dat anotovaných v datech PDT 2.0 do dat PDT 2.5, kontrola konzistence | - transformace diskurzních a anaforických dat anotovaných v datech PDT 2.0 do dat PDT 2.5, kontrola konzistence | ||
| - revize diskurní anotace u vztahů specification, | - revize diskurní anotace u vztahů specification, | ||
| - | - dokončení poloautomatické anotace vnitrovětných vztahů, jejich kontrola a opravy | ||
| - vydání PDiT 1.0 (Prague Discourse Treebank 1.0) | - vydání PDiT 1.0 (Prague Discourse Treebank 1.0) | ||
| - vydání technické zprávy Manual for Annotation of Discourse Relations in the PDT | - vydání technické zprávy Manual for Annotation of Discourse Relations in the PDT | ||
| - | === 2) === | + | |
| + | - prvotní srovnání anotace PDiT a PDTB; srovnání mezianotátorské shody, problémových případů | ||
| + | - workshop ve Filadelfii zabývající se různými taxonomiemi v různých diskurzních projektech | ||
| + | |||
| + | - pracovní verze anotačních pokynů pro anotaci aktuálního členění v angličtině | ||
| + | - studium vybraných jevů v kontextově zapojené a nezapojené části věty | ||
| + | |||
| + | - poloautomatická anotace vnitrovětných vztahů, jejich kontrola a opravy | ||
| + | - studium diskurzního vztahu příčiny | ||
| + | |||
| + | - studium vztahu pořadí slov, kontextové nezapojenosti a neurčitého členu v angličtině | ||
| + | |||
| + | - aplikace procedury pro automatickou anotaci aktivovanosti větných prvků na data PDT; studium výsledných grafů | ||
| + | |||
| + | - implementace jazykové hry PlayCoref pro iOS | ||
