پاورپوینت سیستم باز شناسی گفتار (pptx) 65 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 65 اسلاید
قسمتی از متن PowerPoint (.pptx) :
خرداد 1388
تکنولوژي بازشناسي گفتار فارسيبا رويکردي به صنعت بانکداري
بازشناسی گفتار (فارسي) در صنعت بانکداري
فهرست
معرفی تکنولوژی بازشناسی گفتار
مروري بر کاربردهاي بازشناسي گفتار
نمايش عملي سامانه تايپ گفتاري فارسي نويسا
نمايش عملي يک سيستم ديالوگ تلفني ويژه بانکداري
پرسش و پاسخ
عصر گويش پرداز (ASR Gooyesh Pardaz)
مروري بر بازشناسي خودکار گفتار (Automatic Speech Recognition- A Review)
بازشناسی گفتار (فارسي) در صنعت بانکداري
سيستمهاي بازشناسي خودکار گفتار-معرفي
گفتار سادهترين و کارآمدترين راه ارتباط انسان هاست
هدف بازشناسي خودکار گفتار Automatic Speech Recognition (ASR)
تبديل گفتار انسان به متن يا دستورالعمل معادل
گفتار ميتواند يک فايل صوتي، ورودي با ميکروفون، از طريق خط تلفن و يا فرمان از راه دور باشد.
بازشناسی گفتار (فارسي) در صنعت بانکداري
سيستمهاي بازشناسي خودکار گفتار-معرفي
يک سيستم بازشناسي کامل :
قادر به بازشناسي گفتار پيوسته و محاورهاي باشد.
گفتار افراد مختلف، حتي با لهجههاي متفاوت را بازشناسي نمايد.
در محيطهاي شلوغ و نويزي هم جوابگو باشد.
بصورت بلادرنگ عمل کند.
قادر به فراگيري اطلاعات جديد نظير کلمات، قوانين زباني و . . . باشد.
سيستمهاي کاربردي امروزي:
گفتار بايستي به صورت کتابي باشد.
گفتار بايستي بر اساس حالت استاندارد زبان باشد و تغييرات مربوط به لهجهها منجر به کاهش کارايي ميشود.
استفاده از آنها در محيط و شرايط نويزي منجر به افت کارايي و دقت آنها ميشود.
اغلب سيستم هاي کاربردي امروزي تقريبا بلادرنگ هستند.
سيستمهاي موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زباني و معنايي به صورت محدود استفاده ميکنند.
بازشناسی گفتار (فارسي) در صنعت بانکداري
سيستمهاي بازشناسي خودکار گفتار-پيچيدگيها
بازشناسي گفتار کار پيچيده اي است
ارتباط انسان با ماشين امروزه بر پايه دکمه ها و کليدهاست، نه گفتار
اگر شما يک کلمه خاص مانند ”آسمان“ را 10 بار مختلف بيان نماييد، تقريبا در هيچ دو حالتي فايل هاي ضبط شده ديجيتالي آنها دقيقا يکسان نيست!
پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
ميزان وابستگي يا استقلال از گوينده
پيوسته يا گسسته بودن گفتار
اندازهي واژگان
محدوديتهاي زباني
کارايي در حضور نويز و در محيطهاي کاربردي مختلف
ابهام آکوستيکي و ميزان اشتباه بين کلمات
بازشناسی گفتار (فارسي) در صنعت بانکداري
سيستمهاي بازشناسي خودکار گفتار-پيچيدگيها
پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
ميزان وابستگي يا استقلال از گوينده
گوينده هاي مختلف از نظر مشخصات صدا، سن، لهجه، جنس، نحوه صحبت کردن و ... با هم متفاوتند
وابسته به گوينده (SD: Speaker Dependent): به يک و يا چند گوينده خاص پاسخ ميدهد
مستقل از گوينده (SI: Speaker Independent) به تمام گويندگان يک زبان پاسخ ميدهند
بيشتر روشهاي بازشناسي گفتار امروزي قادرند به هر دو صورت عمل کنند. وابستگي يا استقلال از گوينده در مورد يک سيستم بازشناسي گفتار، در مرحلهي آموزش مشخص ميشود.
دقت بازشناسي در حالت وابسته به گوينده (بعلت محدوديت و تنوع کمتر) بالاتر از حالت مستقل از گوينده (بعلت پيچيدگي بيشتر) است ولي نياز به آموزش سيستم به صداي آن کاربر خاص را دارد.
در کاربردهاي واقعي که گوينده از ابتدا مشخص نيست سيستم را مستقل از گوينده آموزش داده ميشود و سپس هنگام استفاده به کمک برخي رويکردها مانند تطبيق (Adaptation)، سيستم براي يک گوينده خاص تطبيق ميشود.
در برخي کاربردهاي ديگر مانند بازشناسي از پشت خط تلفن وابسته به گوينده بودن چندان معني خاصي ندارد چون گوينده از ابتدا مشخص نيست.
بازشناسی گفتار (فارسي) در صنعت بانکداري
سيستمهاي بازشناسي خودکار گفتار-پيچيدگيها
پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
پيوسته يا گسسته بودن گفتار
محدوديت بر نحوة اداي کلمات توسط گوينده ميزان پيوستگي يا گسستگي کلمات
بازشناسي کلمات مجزا (IWR: Isolated Word Recognition)
گفتار کلمه به کلمه و کاملاً مجزا – هر فايل صوتي يک کلمه
بازشناسي گفتار متصل (Connected Word Recognition)
دنبالهاي از کلمات که به وسيلة سکوتي کوتاه از هم جدا شوند – هر فايل چند کلمه با سکوت در بين کلمات
بازشناسي گفتار پيوسته کتابي (CSR: Continuous Speech Recognition)
گفتار به صورت ديکته کتابي و روان
بازشناسي گفتار پيوسته محاوره اي (Spontaneous Speech)
گفتار به صورت کاملاً طبيعي بيان ميشود، شامل جملات ناقص، سرفه، تپق، مکثهاي طولاني و ... است.
پيچيدگي بازشناسي گفتار پيوسته و فيالبداهه بسيار زياد است (مشکلات ناشي از اثر بافت مانند مشخص نبودن مرز کلمات متوالي و ادغام شدن ابتداي يک کلمه با انتهاي کلمة قبلي)
سيستمهاي امروزي فقط براي خواندن کتابي کاربردي هستند و تشخيص گفتار فيالبداهه يکي از زمينههاي فعال تحقيقات ميباشد.
بازشناسی گفتار (فارسي) در صنعت بانکداري
سيستمهاي بازشناسي خودکار گفتار-پيچيدگيها
پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
اندازهي واژگان
اندازة واژگان يا تعداد کلمات مورد استفاده در يک سيستم بازشناسي از عوامل موثر در دقت و سرعت سيستم است. سيستمهاي IWR فقط براي تشخيص تعداد محدودي کلمه طراحي شدهاند درحاليکه بعضي ديگر از سيستمها قادرند مجموعة بزرگي از کلمات را تشخيص دهند.
معمولاً دقت يک سيستم بازشناسي با افزايش تعداد کلمات کم ميشود. چرا که در اين حالت کلمات شبيه به هم زياد شده و احتمال جايگزيني يک کلمه با ديگري بيشتر است.
واژگان کوچک(Small Vocabulary): 1 تا 99 کلمه
واژگان متوسط (Medium Vocabulary): بين 100 تا 1000 کلمه
واژگان بزرگ (Large Vocabulary) : بين 1000 تا 60000 کلمه
واژگان خيلي بزرگ (Very Large Vocabulary): بيشتر از 60000 کلمه