[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
pdtsc:todo [2008/03/18 09:30]
mikulova
pdtsc:todo [2009/02/02 10:19]
mikulova
Line 1: Line 1:
 ====== Rekonstrukce standardizovaného textu z mluvené řeči ====== ====== Rekonstrukce standardizovaného textu z mluvené řeči ======
 +Více informací je na [[:pdtsc:internal:start|interních stránkách]].
 +
 Rekonstrukce standardizovaného textu z mluvené řeči představuje nový způsob definice rozhraní mezi systémy automatického rozpoznávání řeči a systémy hloubkové (významové) analýzy (psaného) textu. Vychází z přesvědčení, že při syntakticko-sémantické analýze, tj. při zachycování významu promluv, není nutné zohledňovat specifické jevy mluvené řeči, ale nezbytně nutné je pouze zachovat významy původních vyřčených segmentů a tyto významy zachytit v anotaci. Rekonstrukce standardizovaného textu z mluvené řeči představuje nový způsob definice rozhraní mezi systémy automatického rozpoznávání řeči a systémy hloubkové (významové) analýzy (psaného) textu. Vychází z přesvědčení, že při syntakticko-sémantické analýze, tj. při zachycování významu promluv, není nutné zohledňovat specifické jevy mluvené řeči, ale nezbytně nutné je pouze zachovat významy původních vyřčených segmentů a tyto významy zachytit v anotaci.
  
-Při anotaci rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny počítáme třemi hierarchicky uspořádanými rovinami:+Při anotaci rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny počítáme se třemi hierarchicky uspořádanými rovinami:
   * **z-rovina**: nejnižší rovina korpusu. Obsahuje automaticky rozpoznané a automaticky segmentované promluvy.   * **z-rovina**: nejnižší rovina korpusu. Obsahuje automaticky rozpoznané a automaticky segmentované promluvy.
   * **w-rovina**: zachycuje manuálně transkribovaný text promluvy, tj. to, co mluvčí řekl, včetně všech přeřeknutí, zakašlání, pauz apod.   * **w-rovina**: zachycuje manuálně transkribovaný text promluvy, tj. to, co mluvčí řekl, včetně všech přeřeknutí, zakašlání, pauz apod.
Line 10: Line 12:
  
  
 +
 +===== Jak jsme daleko =====
 +Oficiální zahájení anotací: **19. 12. 2007**
 +
 +[[https://blackbird.ms.mff.cuni.cz/cgi-bin/pajas/svn_file_view.pl|On-line prohlížeč anotovaných souborů]]
 +
 +
 +
 +===== Pravidla anotace =====
 +Aktuální verze anotačního manuálu: {{pdtsc:tr-2008-38.pdf|tr-2008-38}}
 +
 +===== Anotační nástroj: MEd =====
 +Přehled anotačních maker: 

[ Back to the navigation ] [ Back to the content ]