فروش لپ تاپ نو و استوک بازاریان فروش عطر و ادکلن پرفیومی محمد طاها لطفی | taha lotfi طراحی سایت و دیجیتال مارکتینگ تاترین ، تاترین سکوی پرتاب برند شما توسعه سامانه شناسایی و استخراج متون دست‌نویس پیوسته فارسی از روی تصاویر با استفاده از فناوری OCR
اشتراک گذاری با دوستان
اشتراک گذاری در linkedin
اشتراک گذاری در twitter
اشتراک گذاری در facebook
اشتراک گذاری در telegram
اشتراک گذاری در whatsapp

وضعیت: بسته

  شماره سند:

  تاریخ انتشار: ۱۴۰۰/۰۹/۲۸

  مهلت ارسال پیشنهاد: ۱۴۰۰/۱۰/۱۵

  فرصت‌ها: براساس پیشنهاد‌ها قابل‌ مذاکره خواهد بود.

 تماس : ۰۲۱۸۸۳۹۸۵۶۳ – ۰۲۱۸۸۳۹۸۵۴۳

  ارسال پروپوزال‌ها: https://ghazal.inif.ir/grant

ضرورت مسئله

همگام با پیشرفت اتوماسیون اداری و تبدیل مستندات کاغذی به فایل‌های دیجیتالی، نیاز به نرم‌افزارهای هوشمند برای ورود اطلاعات به رایانه، بدون دخالت انسان ضروری به نظر می‌رسد. با کمک فناوری تشخیص کاراکتر به صورت نوری (نویسه‌خوان نوری) یا OCR  می‌توان متن را از داخل عکس استخراج نمود. متون فارسی به دو صورت چاپی و دست‌نویس موجود هستند که در حال حاضر، با استفاده از  OCR، تصویر متون تایپی در روزنامه، مجلات، کتاب‌ها و اسناد دیگر قابلیت تبدیل به متن را دارند. البته متون دست‌نوشته نیز امکان بازشناسی دارند، اما تبدیل این دسته از اسناد به متن، کار دشوارتری است، زیرا نحوه نوشتن انسان‌ها باهم بسیار متفاوت بوده و تشخیص نماد و حروف در این اسناد مشکل است.

متون دست‌نویس به دو صورت «گسسته» و «پیوسته» وجود دارند؛
متن دست‌نویس گسسته شامل کلیه متون نگارش‌یافته با دست است که حروف در آن از قالب و شکل ثابتی پیروی نمی‌کند. این متون، شامل نوشته‌هایی هستند که حروف، جدا از هم و به صورت گسسته نوشته شده‌اند (به‌عنوان نمونه؛ وارد نمودن نام و نام‌خانوادگی در فرم‌هایی که هر حرف از کلمه، داخل یک کادر نوشته می‌شود). در حالت پیوسته، حروف به صورت پیوسته نوشته می‌شوند و کلمات و جملات را تشکیل می‌دهند.

فناوری OCR در متون دست‌نویس گسسته تنها قادر به تشخیص حروف است، اما این فناوری در مورد متون دست‌نویس پیوسته، یعنی همان نوشته‌های رایجی که با دست بر روی کاغذ نوشته می‌شود، باید قادر به تشخیص کلمات باشد.

مشروح مسئله تحقیقاتی

هدف از این طرح تحقیقاتی، توسعه سامانه‌ای جهت تبدیل تصویر دست‌نویس پیوسته فارسی به متن است. سامانه توسعه‌یافته باید قادر به تشخیص انواع فرم‌های دست‌نویس و استخراج اطلاعات متنی و عددی از متون دست‌نویس پیوسته فارسی باشد. این سامانه، تصاویر اسکن شده را به‌عنوان ورودی دریافت نموده و پس از پردازش آن‌ها با سرعت بالا، اطلاعات متنی، عددی و همچنین علائم نگارشی موجود بر روی متن یا فرم را تشخیص داده و وارد بانک اطلاعاتی می‌نماید.

سامانه موردنیاز بایستی قابلیت تبدیل متون دست‌خط پیوسته فارسی به متن تایپ‌شده را داشته باشد. همچنین باید قادر به تشخیص انواع اعداد، نمادها، کاراکترها و علائم نگارشی و حروف و کلمات فارسی باشد و قابلیت تبدیل آن‌ها به متن تایپ‌شده را داشته باشد. تنوع جملات ورودی به این سامانه محدود به دامنه خاصی نبوده و عمومی است.

تفاوت قابل‌ملاحظه این سامانه با سامانه‌های دیگر، کاهش محدودیت‌هاست. محدودیت‌هایی ازجمله اینکه در متون موردنظر، باید حتماً با خودکار یا مدادی با رنگ مشخص پر شود و همچنین بخش‌های مختلف متون بایستی با رنگ خاصی مانند قرمز نگارش شوند تا ارقام داخل آن قابل‌تشخیص باشد. علاوه بر این، بسیاری از سامانه‌های مشابه نسبت به چرخش یا تغییر اندازه فرم‌ها حساس هستند. حال اینکه در سامانه مورد انتظار این محدودیت باید رفع شود.

سرعت پردازش در این سامانه بایستی بسیار بالا باشد؛ به شکلی که بتواند متون بسیاری را با استفاده از دستگاه‌های اسکنر با سرعت بالا وارد سامانه نموده و به‌سرعت پردازش نماید. سرویس مورد نظر می‌بایست امکان انجام  OCRبر روی 20 تصویر از جملات دست‌نویس را در حداکثر 1 ثانیه داشته باشد. در واقع، تصویر هر جمله می‌بایست در کمتر از 50 میلی ثانیه تبدیل به متن شود.

گام‌های تحقیق

  • امکان‌سنجی و بررسی مدل‌های موجود
  • طراحی معماری سامانه
  • جمع‌آوری دیتاست موردنیاز
  • توسعه الگوریتم‌ها
  • مقایسه و آزمون الگوریتم‌ها
  • بهینه‌سازی الگوریتم‌ها

خروجی‌های مورد انتظار تحقیق

  • سامانه نرم‌افزاری (سمت سرور) استخراج متن دیجیتالی از روی متن دست‌نویس فارسی؛
    با قابلیت سرویس‌دهی از طریق API و حداقل دقت مورد انتظار الگوریتم به‌کاررفته، 98 درصد در سطح جمله و تصاویر ارسالی دست‌نویس

مجموعه داده‌های اعتبارسنجی و تست

  • تست و تحویل نهایی این سامانه بر اساس مجموعه داده‌های مشخصی برای تست خواهد بود.
  • نمونه‌هایی از مجموعه داده‌های تست نهایی به عنوان دیتاست اعتبارسنجی در فرآیند انجام کار به مجری طرح ارائه خواهد شد.
  • توانمندی سامانه در تبدیل متون دست‌نویس به متن تایپ شده نمی‌بایستی محدود به نمونه‌های اعتبارسنجی باشد. به عبارت دیگر، اندازه و تنوع تصاویر دست‌نوشته‌های قابل پردازش توسط سامانه محدود به مجموعه داده‌های اعتبارسنجی نخواهد بود.
  • نمونه هایی از تصاویر اعتبارسنجی سامانه در ذیل آورده شده است:
نمونه شماره 1 از تصاویر ورودی سامانه
نمونه شماره 1 از تصاویر ورودی سامانه
نمونه شماره 1 از تصاویر ورودی سامانه
نمونه شماره 1 از تصاویر ورودی سامانه
نمونه شماره 1 از تصاویر ورودی سامانه
نمونه شماره 1 از تصاویر ورودی سامانه

الزامات تحقیق

  • ورودی این سامانه، تصاویری از جملات برش داده شده‌ دست‌نویس فارسی می‌باشد.
  • قابلیت تشخیص اسناد دست‌نویس فارسی با دقت بالای 98 درصد در سطح جمله در سامانه ارائه شده
  • امکان انجام OCRروی 20 تصویر از جملات دست‌نویس در حداکثر 1 ثانیه
  • تبدیل تصویر هر جمله به متن در کمتر از 50 میلی ثانیه
  • توانایی تشخیص کلمات و اعداد انگلیسی در متن فارسی
  • سرعت پردازش لحظه‌ای (Real-Time)در سامانه ارائه شده
  • قابلیت تشخیص و پشتیبانی از فرمت‌های مختلف تصاویر
  • تشخیص و خواندن چک‌مارک‌ها، اشکال و علائم در اسنادی مانند پاسخنامه‌ها و فرم‌های اطلاعات شخصی
  • خواندن متن‌های پر شده با مداد یا خودکار
  • حداقل رزولوشن تصویر ورودی 200  DPIدر سایز مناسب برای  OCR
  • افزایش قدرت تصمیم و یادگیری سامانه در مرور زمان
  • امکان تعریف دست‌خط‌های خاص به‌منظور افزایش دقت سامانه
  • عدم حساسیت سامانه به چرخش کاغذ
  • آستانه تحمل بالا نسبت به نویزهای ایجادشده در متن، مخصوصاً در زمان اسکن تصویر

 

گلوگاه‌های احتمالی:

در این بخش به مشکلات خط فارسی، یا درواقع ویژگی‌های خاص این خط پرداخته می‌شود؛

  • در زبان فارسی به علت شکل نوشتاری حروف و شباهت برخی حروف به یکدیگر، تبدیل متن به‌عکس دشوار است زیرا حروف یک کلمه به هم می‌چسبند. به عنوان مثال کلمه «فارسی» را در نظر بگیرید. این کلمه دارای حروف چسبیده به هم است و بسیاری از کلمات دیگر در زبان فارسی به صورت چسبیده نوشته می‌شوند. همین موجب دشواری تشخیص حروف در زبان فارسی است. این مشکل در زبانی مانند زبان انگلیسی وجود ندارد. چون در انگلیسی حروف به صورت جدا از هم تایپ می‌شوند. به‌علاوه در زبان فارسی حروف شبیه به هم مختلفی وجود دارند. مثلاً حرف «س» و «ش» و حتی «ص» و «ض» ممکن است در صورت عدم خوانایی کافی باهم اشتباه گرفته شوند. یا مثلاً حروف «ر» و «ز» تنها در یک نقطه کوچک باهم تفاوت دارند.
  • فناوری OCR در حال حاضر مربوط به «دست‌نویس‌های گسسته» یا متن‌های تایپی پیوسته است. چون در دست‌نویس‌های گسسته، اگرچه حروف به هم شباهت دارند، حداقل جداجدا نوشته‌شده‌اند. در متن‌های پیوسته تایپی هم مشکل کشیده شدن یک حرف یا شکسته نوشته شدن حروف وجود ندارد؛ اما بازشناسی متن‌های دست‌نویس پیوسته توسط کامپیوتر کار بسیار دشوارتری است. البته در حال حاضر هم نرم‌افزارهایی وجود دارد که متن دست‌نویس پیوسته را تبدیل به حروف جدا از هم و گسسته می‌کنند، ولی ضریب خطای این نرم‌افزارها زیاد است. در مورد OCR پیوسته دست‌نویس، آنچه کار را دشوارتر می‌کند، قطعه‌بندی و جداجدا کردن حروف به هم چسبیده و تشخیص آن‌هاست.
  • ازجمله چالش‌های OCR دست‌نویس فارسی می‌توان به چسبیده نوشتن حروف، شباهت حروف، بازشناسی حروف و الگو، مدل‌سازی یا پردازش زبانی، بانک‌های اطلاعاتی و بسامد کلمات اشاره نمود که سرویس مورد نظر بایستی قادر به رفع این چالش‌ها باشد.

معیارهای ارزیابی و انتخاب مجری

  • تحصیلات و سوابق تیم تحقیقاتی و تناسب آن با مسئله
  • رویکرد فنی تیم تحقیقاتی به مسئله
  • دسترسی به تجهیزات آزمایشگاهی و مواد اولیه و سایر الزامات اجرای تحقیق
  • زمان و هزینه اجرای تحقیق

تسهیم مالکیت فکری

  • مالکیت معنوی: مجری در مالکیت معنوی ناشی از اجرای تحقیق سهیم خواهد بود و انتشار مقاله مشترک توسط مجری و متقاضی در ژورنال‌های داخلی و خارجی، ارائه مقاله در کنفرانس‌ها و سمینارها با موافقت و اشاره به نام همه دست‌اندرکاران مجاز خواهد بود.
  • مالکیت منافع مادی: با توجه به مدل کسب‌وکار شرکت متقاضی، منافع مالی ناشی از توسعه این فناوری تماماً متعلق به شرکت متقاضی بوده و مجری صرفاً حق‌الزحمه اجرای پروژه تحقیقاتی را دریافت خواهد کرد.

روش ارسال پیشنهاد

پروپوزال‌ها صرفاً باید در چارچوب موردنظر صندوق نوآوری و شکوفایی، تدوین و حداکثر تا تاریخ 15 دی ماه 1400 در سامانه غزال به آدرس https://ghazal.inif.ir/grant ارسال شوند. پروپوزال‌هایی که در چارچوبی غیرازآن، یا به روش‌های دیگر به دست صندوق برسند، وارد فرایند ارزیابی نخواهند شد.