[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

A) Factored Phrase-Based SMT with full morphological generation

Překládáme nezávisle do lemmat a POS značek a z nich potom vygenerujeme patřičnou formu pomoci morfologického slovníku. V úvahu přicházejí tyto překladové scénáře:

A generovací model:

Generování bude dle morfologického slovníku Jarky Hlaváčové. Měli bychom dostat jednoznačné mapování z lemat a značky na formu.

Experimenty:

t: forma→forma

t:forma→forma
a:lemma→lemma
a:forma→lemma

t: lemma→lemma (a testování na lematizovaných referenčních datech)

t: lemma→lemma, tag→tag (a testování na lematizovaných+značkovaných referenčních datech)

t: lemma→lemma, tag→tag g:lemma,tag→forma (target side of parallel data, target language model)

t: lemma→lemma, tag→tag g:lemma,tag→forma (morphological analysis)

Rizika:

Technické detaily:

Data


[ Back to the navigation ] [ Back to the content ]