وبلاگ

توضیح وبلاگ من

بررسی مدل های هایبرید ANN/HMM و Fuzzy HMM در بازشناسی گفتار اتوماتیک

 
تاریخ: 04-12-99
نویسنده: فاطمه کرمانی


خروجی یک فرآیند در جهان واقعی به شکل یک سیگنال پیوسته یا گسسته مشاهده می شود. یک مسئله حیاتی در علوم، ساختن مدل هایی برای این سیگنال واقعی است. مدل سازی یک سیگنال مزایای فراوانی به همراه دارد. اولا، مدل، پایه ای برای توصیف نظری سیگنال فراهم می کند که می تواند برای پردازش سیگنال استفاده شود تا خروجی خواص مطلوبی داشته باشد. ثانیا، مدل می تواند اطلاعات بسیار مفیدی درباره منبع سیگنال بدهد، بدون اینکه احتیاجی به خود منبع باشد. نهایتا و از همه مهمتر، مدل ها می توانند در عمل به خوبی کار کنند و امکان تحقق سیستم های عملی مهمی را فراهم آورند.

بسته به نوع سیگنال، راه های مختلفی برای مدل کردن آن وجود دارد. به طور کلی، یک سیگنال می تواند معین یا نامعین (تصادفی یا آماری) باشد. مدل های معین از بعضی خواص شناخته شده سیگنال استفاده می کنند و مقادیر پارامترهای مدل را تخمین می زنند. از طرف دیگر، در مدل های آماری، یک فرآیند تصادفی، سیگنال را توصیف می کند. برای کاربردهایی نظیر تشخیص گفتار یا دستخط که با نویز و عدم قطعیت همراه هستند، مدل های آماری از کارایی بهتری برخوردارند. مدل های مخفی مارکف، که همچنین منابع مارکف یا توابع

دانلود مقالات

 آماری زنجیره ای مارکف نامیده می شوند، در تئوری مخابرات یکی از پرکاربردترین مدل های آماری هستند.

فصل اول: کلیات
1-1- هدف
مشکل بازشناسی گفتار را می توان با یک رابطه آماری فرموله نمود. اگر W را تعداد لغات مجاز یک فرهنگ لغت مشخص، فرض کنیم، مطابق رابطه زیر که به قاعده بیز مشهور است، خواهیم داشت:
Pr(W|X)=Pr(X|W)Pr(W)/Pr(X
که در آن برای بردار ویژگی X، وظیفه ما یافتن رشته ای از لغات به نحوی است که احتمال بالا را ماکزیمم نماید. کمیت Pr(w، معمولا به نام مدل زبانی (LM) شناخته شده و به اطلاعات هر زبان خاص بازمی گردد، که وجود یک رشته از کلمات را در کنار یکدیگر مجاز می سازد، کمیت Pr(X|W که آن را به نام مدل آوایی می شناسیم، توصیف کننده وضعیت آماری دنباله های مشاهدات آکوستیکی پارامتری شده مرتبط با هر کلمه تلفظ شده می باشد. به عنوان نمونه مدل زبانی به ما کمک می کند که ما عبارت “bad boy”  را شنیده ایم نه “pad boy”، در حالی که مدل آوایی با جنبه تلفظ کلمات سروکار دارد و مثلا به ما می گوید که “cat” را به صورت “kat” ادا می نماید.


فرم در حال بارگذاری ...

« آشنایی با IPv6شناخت معماری امنیتی در شبکه 3.XG و تحلیل مخاطرات و تهدیدات امنیتی آن »
 
مداحی های محرم