[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
pdtsc:todo [2008/01/14 10:06]
mikulova
pdtsc:todo [2009/02/02 10:22] (current)
mikulova
Line 1: Line 1:
 ====== Rekonstrukce standardizovaného textu z mluvené řeči ====== ====== Rekonstrukce standardizovaného textu z mluvené řeči ======
-V současné době probíhá vyhodnocování dosavadní práce na projektuPracuje se na novém návrhu systému rovin pro PDTSCna novém manuálu pro rekonstrukci standardizovaného textu a na novém anotačním nástroji.+Více informací je na [[:pdtsc:internal:start|interních stránkách]]. 
 + 
 +Rekonstrukce standardizovaného textu z mluvené řeči představuje nový způsob definice rozhraní mezi systémy automatického rozpoznávání řeči a systémy hloubkové (významové) analýzy (psaného) textu. Vychází z přesvědčení, že při syntakticko-sémantické analýze, tjpři zachycování významu promluvnení nutné zohledňovat specifické jevy mluvené řeči, ale nezbytně nutné je pouze zachovat významy původních vyřčených segmentů a tyto významy zachytit v anotaci. 
 + 
 +Při anotaci rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny počítáme se třemi hierarchicky uspořádanými rovinami: 
 +  * **z-rovina**: nejnižší rovina korpusu. Obsahuje automaticky rozpoznané automaticky segmentované promluvy. 
 +  * **w-rovina**: zachycuje manuálně transkribovaný text promluvy, tj. to, co mluvčí řekl, včetně všech přeřeknutí, zakašlání, pauz apod. 
 +  * **m-rovina**: obsahuje standardizovaný text, na kterém se následně provede morfologická anotace (text pak může být anotován na vyšších syntaktických rovinách). 
 + 
 +Klíčové při tomto postupu je **zachování vazeb** mezi původní transkripcí (na w-rovině) a standardizovaným textem (na m-rovině). Propojeny jsou i jednotky w-roviny a z-roviny. 
 + 
 + 
 + 
 +===== Jak jsme daleko ===== 
 +Oficiální zahájení anotací: **19. 12. 2007** 
 + 
 +[[https://blackbird.ms.mff.cuni.cz/cgi-bin/pajas/svn_file_view.pl|On-line prohlížeč anotovaných souborů]] 
 + 
 + 
 + 
 +===== Pravidla anotace ===== 
 +Aktuální verze anotačního manuálu: {{pdtsc:tr-2008-38.pdf|tr-2008-38}} 
 + 
 + 
 +===== Anotační nástroj: MEd ===== 
 +Anotační nástroj MEd má své stránky zde: [[https://ufal.mff.cuni.cz/pajas:med|Anotační nástroj: Med]]
  

[ Back to the navigation ] [ Back to the content ]