[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
pdtsc:todo [2008/03/18 11:18]
mikulova
pdtsc:todo [2009/02/02 10:22] (current)
mikulova
Line 4: Line 4:
 Rekonstrukce standardizovaného textu z mluvené řeči představuje nový způsob definice rozhraní mezi systémy automatického rozpoznávání řeči a systémy hloubkové (významové) analýzy (psaného) textu. Vychází z přesvědčení, že při syntakticko-sémantické analýze, tj. při zachycování významu promluv, není nutné zohledňovat specifické jevy mluvené řeči, ale nezbytně nutné je pouze zachovat významy původních vyřčených segmentů a tyto významy zachytit v anotaci. Rekonstrukce standardizovaného textu z mluvené řeči představuje nový způsob definice rozhraní mezi systémy automatického rozpoznávání řeči a systémy hloubkové (významové) analýzy (psaného) textu. Vychází z přesvědčení, že při syntakticko-sémantické analýze, tj. při zachycování významu promluv, není nutné zohledňovat specifické jevy mluvené řeči, ale nezbytně nutné je pouze zachovat významy původních vyřčených segmentů a tyto významy zachytit v anotaci.
  
-Při anotaci rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny počítáme třemi hierarchicky uspořádanými rovinami:+Při anotaci rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny počítáme se třemi hierarchicky uspořádanými rovinami:
   * **z-rovina**: nejnižší rovina korpusu. Obsahuje automaticky rozpoznané a automaticky segmentované promluvy.   * **z-rovina**: nejnižší rovina korpusu. Obsahuje automaticky rozpoznané a automaticky segmentované promluvy.
   * **w-rovina**: zachycuje manuálně transkribovaný text promluvy, tj. to, co mluvčí řekl, včetně všech přeřeknutí, zakašlání, pauz apod.   * **w-rovina**: zachycuje manuálně transkribovaný text promluvy, tj. to, co mluvčí řekl, včetně všech přeřeknutí, zakašlání, pauz apod.
Line 10: Line 10:
  
 Klíčové při tomto postupu je **zachování vazeb** mezi původní transkripcí (na w-rovině) a standardizovaným textem (na m-rovině). Propojeny jsou i jednotky w-roviny a z-roviny. Klíčové při tomto postupu je **zachování vazeb** mezi původní transkripcí (na w-rovině) a standardizovaným textem (na m-rovině). Propojeny jsou i jednotky w-roviny a z-roviny.
 +
  
  
 ===== Jak jsme daleko ===== ===== Jak jsme daleko =====
 Oficiální zahájení anotací: **19. 12. 2007** Oficiální zahájení anotací: **19. 12. 2007**
-Anotují čtyři anotátorky. 
  
-[[https://blackbird.ms.mff.cuni.cz/cgi-bin/pajas/svn_view.pl|On-line prohlížeč anotovaných souborů]]+[[https://blackbird.ms.mff.cuni.cz/cgi-bin/pajas/svn_file_view.pl|On-line prohlížeč anotovaných souborů]]
  
-===== Pravidla anotace ===== 
-Aktuální verze anotačního manuálu: {{pdtsc:speech_reconstruction_guide_080304.doc|speech_reconstruction_guide_080304}} 
  
-===== Anotační nástroj: MEd ===== 
-Přehled anotačních maker:  
  
 +===== Pravidla anotace =====
 +Aktuální verze anotačního manuálu: {{pdtsc:tr-2008-38.pdf|tr-2008-38}}
  
 +
 +===== Anotační nástroj: MEd =====
 +Anotační nástroj MEd má své stránky zde: [[https://ufal.mff.cuni.cz/pajas:med|Anotační nástroj: Med]]
  

[ Back to the navigation ] [ Back to the content ]