وضعیت: باز
شماره سند:
تاریخ انتشار: 1403/01/20
مهلت ارسال پیشنهاد: 1403/05/06
فرصتها: براساس پیشنهادها قابل مذاکره خواهد بود.
تماس : 02166539734 – 02166533864
ارسال پروپوزالها: https://ghazal.inif.ir
هدف از این طرح پژوهشی، توسعه سامانه هوشمند دستیار صوتی کٌردی، با قابلیت تبدیل دریافت داده صوتی از کاربر و ارائه پاسخ متناسب با درخواست کاربر است. این دستیار صوتی، امکان برقراری ارتباط با کاربر را دارد و از سه بخش زیر تشکیل شده است؛
طرح “دستیار صوتی هوشمند کٌردی” به عنوان یک پروژه کاربردی در زمینه هوش مصنوعی و پردازش زبان طبیعی تعریف شده است و با توسعه آن، امکان ارتباط و انجام وظایف مختلف با استفاده از گفتار برای کاربران فراهم میشود. با توسعه این طرح انتظار میرود که یک دستیار صوتی هوشمند کامل و کارآمد برای زبان کٌردی توسعه یابد که به کاربران این زبان امکان ارائه خدمات متنوع و بهروز را با استفاده از گفتار فراهم نماید. این دستیار باید قابلیت به روزرسانی با توجه به کاربردهای مختلف در صنایع مختلف را داشته باشد.
نام و نام خانوادگی | وضعیت شغلی | همکار/مشاور طرح | رشته/مقطع تحصیلی |
فاطمه دانشفر | عضو هیات علمی | مجری | دکتری هوش مصنوعی |
سیوان سلیمانبیگی | دانشجو | همکار | دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه کردستان |
پدرام یمینی | دانشجو | همکار | دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه کردستان |
اسامه نصرالهی | دانشجو | همکار | دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه کردستان |
مهران دانشفر | محقق | همکار | کارشناسی ارشد مهندسی کامپیوتر دانشگاه ارومیه |
محمد معین فر | محقق | همکار | کارشناسی مهندسی کامپیوتر فنی حرفهای آمل |
محمد سلامی | محقق | همکار | کارشناسی مهندسی کامپیوتر دانشگاه کردستان |
دکتر فاطمه دانشفر، استادیار گروه مهندسی کامپیوتر دانشگاه کردستان هستند. ایشان بیش از 60 مقاله در مجلات و کنفرانسهای بینالمللی به چاپ رساندهاند و استاد راهنما و مشاور بیش از 30 دانشجوی کارشناسی ارشد و دکتری بودهاند. شاخص h-index مقالات منتشرشده ایشان 16 است. ایشان در چهار سال اخیر مجری چندین پروژه پژوهشی در زمینه پردازش هوشمند متن کٌردی مختلف بودهاند.
زبان کردی یکی از زبانهای غنی با سابقهای چند هزار ساله است که توسط میلیونها نفر در سراسر جهان، به ویژه در ایران، عراق، ترکیه و سوریه صحبت میشود. با وجود این سابقه و گستردگی، زبان کردی از نظر فناوریهای نوین، تا حد زیادی نادیده گرفته شده است. انتخاب زبان کردی برای این طرح به چند دلیل ضروری است:
در نهایت، انتخاب زبان کردی برای این طرح نه تنها به حفظ و ترویج این زبان غنی کمک میکند، بلکه به توانمندسازی جامعه کرد، افزایش دسترسی به اطلاعات و پر کردن خلاء موجود در زمینه فناوریهای زبانی کردی نیز میانجامد.
دستیار صوتی هوشمند پیشنهاد شده یک رویکرد جدید و نوآورانه برای سادهسازی عملیات و توانمندسازی کاربران است. در حالی که ادبیات محدودی در مورد کاربرد خاص مدلهای گفتار به گفتار کٌردی وجود دارد، پژوهشهای بسیاری در مورد استفاده از هوش مصنوعی و یادگیری ماشین در سایر حوزهها تاکنون انجام شده است. این درحالی است که تاکنون توسعه سیستمهای گفتاری هوشمند در زبان کٌردی به اندازه سایر زبانها، مانند فارسی، پیشرفت چندانی نداشته است. سیستمهای مذکور در حوزه زبان فارسی، امکانات و خدمات گوناگونی را برای کاربران ارائه میدهند که از جمله میتوان به امکان ارتباط صوتی و چتبات هوش مصنوعی، تولید گزارشات و ارائه خدمات به شرکتها، ادارات و کارخانهها اشاره نمود.
این محصول براساس زبان کردی گویش سورانی مرکزی طراحی خواهد شد. چالش توسعه این محصول شامل گردآوری داده و آموزش مدل است. این چالش همچنین فرصتهای بسیاری را برای توسعهدهندگان، محققان و شرکتهای فعال در حوزه فناوری اطلاعات فراهم میکند تا بهروزرسانیهای لازم در این حوزه را انجام دهند و سیستمهای هوشمند و نوآورانهای را بر اساس زبان کٌردی به ارمغان بیاورند.
این محصول با ادغام چندین فناوری از جمله تشخیص گفتار کٌردی، چتبات کٌردی، سنتز گفتار کٌردی توسعه خواهد یافت تا یک دستیار صوتی گفتار به گفتار جامع از ابتدا به انتها ایجاد شود. همچنین این پیشنهاد شامل تنظیم دقیق مدلهای از پیشآموزشدیده تشخیص گفتار کٌردی (درصورت نیاز در فاز بعدی)، برای تفسیر دقیق و تولید گزارشهای مرتبط متناسب با نیازهای کاربران، تولید و توسعه چتبات کٌردی و همچنین توسعه یک API بصری و کاربرپسند برای ادغام یکپارچه برای سهولت استفاده کاربران میباشد. مراحل انجام پژوهش همانطور که در شکل زیر مشخص است، به شرح زیر است:
1.جمعآوری داده و اعتبارسنجی داده: برای ایجاد مدلهای هوش مصنوعی نیاز است که دادگان موردنیاز هر بخش از مدلهای موجود تهیه و استانداردسازی شود. در اين مرحله پيكره لازم براي تنظيم مجدد مدلهای موجود تبديل گفتار به متن كردي (ASR) و تبديل متن به گفتار كردي (TTS) كه تاکنون طراحي و عرضه شدهاند، بصورت اختصاصي براي حوزه بازار و صنعت گردآوری خواهند شد. اين پيكره، ميبايست شامل حداقل یک ساعت صوت از مكالمات تخصصي ادا شده در محيط بدون نويز توسط چندين نفر باشد. البته در فاز اوليه طرح، با توجه به نتايج ارزيابی مناسب به دست آمده از API هاي موجود براي ASR و TTS كردی، نيازی به جمعآوری و ايجاد پيكره آموزشي براي تنظيم مجدد نخواهد بود.
2. تبدیل گفتار کٌردی به متن کٌردی: در این فاز هدف تبدیل گفتار کٌردی به متن کٌردی است. در اين بخش از API موجود و آماده برای زبان کردی استفاده خواهد شد. طبق آزمايشاتي كه انجام شده، اين API با تبديل ١٠٠جمله صوتي كردي آزمايشي (از مجموعه آزمايشي ما) به متن كردی، ضريب اطمينان بالايی را بدست آورده است. طبق مذاكرات انجام شده اين API به مدت يك ماه بصورت رايگان در اختيار ما قرار خواهد داشت و سپس طبق نرخهای مصوب كه در جدول زیر مشخص شده است، هزينه بردار خواهد بود.
3.توسعه مدل چت بابت کٌردی: در این فاز هدف تولید مدل چتبات کردی است که متن ورودی را به زبان کردی دریافت کرده سپس بااستفاده از چارچوب RASA و actionهاي مناسب تعريف شده، پاسخ مورد نظر به زبان كردي دریافت شده و در اختيار ماژول بعدی قرار ميگيرد.
4.تبدیل متن کٌردی به گفتار کٌردی: در این فاز هدف تبدیل متن کٌردی به گفتار کٌردی است. در اين بخش از API آماده برای زبان کردی استفاده خواهد شد. اين API طبق مذاكرات انجام شده، به مدت يك یک ماه بصورت رايگان در اختيار ما قرار خواهد گرفت و نتايج تستهاي اوليه روي آن بسيار عالي بوده است.
5.توسعه نرم افزار: توسعه يك محيط نرم افزاري كاربرپسند قابل راه اندازي روي موبايل و اينترنت.