[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

Rekonstrukce standardizovaného textu z mluvené řeči

Více informací je na interních stránkách.

Rekonstrukce standardizovaného textu z mluvené řeči představuje nový způsob definice rozhraní mezi systémy automatického rozpoznávání řeči a systémy hloubkové (významové) analýzy (psaného) textu. Vychází z přesvědčení, že při syntakticko-sémantické analýze, tj. při zachycování významu promluv, není nutné zohledňovat specifické jevy mluvené řeči, ale nezbytně nutné je pouze zachovat významy původních vyřčených segmentů a tyto významy zachytit v anotaci.

Při anotaci rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny počítáme třemi hierarchicky uspořádanými rovinami:

Klíčové při tomto postupu je zachování vazeb mezi původní transkripcí (na w-rovině) a standardizovaným textem (na m-rovině). Propojeny jsou i jednotky w-roviny a z-roviny.

Jak jsme daleko

Oficiální zahájení anotací: 19. 12. 2007
Anotují čtyři anotátorky.

On-line prohlížeč anotovaných souborů

Pravidla anotace

Aktuální verze anotačního manuálu: speech_reconstruction_guide_080304

Anotační nástroj: MEd

Přehled anotačních maker:


[ Back to the navigation ] [ Back to the content ]