[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
pdtsc:todo [2008/01/14 10:06]
mikulova
pdtsc:todo [2009/02/02 10:19]
mikulova
Line 1: Line 1:
 ====== Rekonstrukce standardizovaného textu z mluvené řeči ====== ====== Rekonstrukce standardizovaného textu z mluvené řeči ======
-V současné době probíhá vyhodnocování dosavadní práce na projektu. Pracuje se na novém návrhu systému rovin pro PDTSC, na novém manuálu pro rekonstrukci standardizovaného textu a na novém anotačním nástroji.+Více informací je na [[:pdtsc:internal:start|interních stránkách]].
  
 +Rekonstrukce standardizovaného textu z mluvené řeči představuje nový způsob definice rozhraní mezi systémy automatického rozpoznávání řeči a systémy hloubkové (významové) analýzy (psaného) textu. Vychází z přesvědčení, že při syntakticko-sémantické analýze, tj. při zachycování významu promluv, není nutné zohledňovat specifické jevy mluvené řeči, ale nezbytně nutné je pouze zachovat významy původních vyřčených segmentů a tyto významy zachytit v anotaci.
 +
 +Při anotaci rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny počítáme se třemi hierarchicky uspořádanými rovinami:
 +  * **z-rovina**: nejnižší rovina korpusu. Obsahuje automaticky rozpoznané a automaticky segmentované promluvy.
 +  * **w-rovina**: zachycuje manuálně transkribovaný text promluvy, tj. to, co mluvčí řekl, včetně všech přeřeknutí, zakašlání, pauz apod.
 +  * **m-rovina**: obsahuje standardizovaný text, na kterém se následně provede morfologická anotace (text pak může být anotován na vyšších syntaktických rovinách).
 +
 +Klíčové při tomto postupu je **zachování vazeb** mezi původní transkripcí (na w-rovině) a standardizovaným textem (na m-rovině). Propojeny jsou i jednotky w-roviny a z-roviny.
 +
 +
 +
 +===== Jak jsme daleko =====
 +Oficiální zahájení anotací: **19. 12. 2007**
 +
 +[[https://blackbird.ms.mff.cuni.cz/cgi-bin/pajas/svn_file_view.pl|On-line prohlížeč anotovaných souborů]]
 +
 +
 +
 +===== Pravidla anotace =====
 +Aktuální verze anotačního manuálu: {{pdtsc:tr-2008-38.pdf|tr-2008-38}}
 +
 +===== Anotační nástroj: MEd =====
 +Přehled anotačních maker: 

[ Back to the navigation ] [ Back to the content ]