مایکروسافت با نرم‌افزار شگفت‌انگیز Seeing AI به کمک نابینایان آمد

مقدمه

اگر کاربر سیستم‌عامل آی‌اواس اپل یا اندروید گوگل باشید، حتماً دست‌کم یک نرم‌افزار او سی آر یا همان تشخیص نوری حروف و مبدل تصویر به متن را روی تلفن همراهتان نصب کرده‌اید. این نرم‌افزارها به کاربران امکان می‌دهند با گرفتن عکس از یک صفحه کتاب، مجله یا هر نوشته‌ای که در اختیار دارند، متون مندرج در آن را با قابلیت ویرایش دریافت کنند.

شاید نخستین نرم‌افزاری که در سالیان اخیر با ورودش به فروشگاه نرم‌افزار اپل توانست تبدیل تصاویر به متون را برای افراد دارای معلولیت بینایی به گونه‌ای جدی‌تر و حرفه‌ای‌تر مطرح کند، KNFB Reader بود. بعدها نسخه اندرویدی آن هم روانه بازار شد؛ اما، اگر از تخفیف‌های گاه و بی‌گاه آن بگذریم، پرداخت حدود 100 دلار برای خرید این نرم‌افزار از عهده بسیاری از کاربران خارج است. البته ذکر این نکته هم خالی از لطف نیست که حتی در سال 2008 و پیش از ظهور اپل و گوگل به عنوان بازیگران اصلی در حوزه تلفن‌های همراه هوشمند، امکان استفاده از این نرم‌افزار برای گوشی Nokia N82 فراهم شده بود. برای کسب اطلاعات بیشتر، به این صفحه فروش محصول و این مقاله جالب رجوع کنید.

به هر حال، گذشت زمان سبب شد جدا از KNFB Reader با نرم‌افزارهای دیگری هم در این حوزه آشنا شویم. حالا یکی از جذاب‌ترین آن‌ها — که البته هنوز نسخه اندرویدی ندارد، Seeing AI: Talking Camera for the Blind است. می‌توان آن را “هوش مصنوعی بینا: دوربین گویا برای نابینایان” هم ترجمه کرد.

نرم‌افزار Seeing AI چه قابلیت‌های ویژه‌ای دارد؟

کوتاه و مختصر، اغراق نیست اگر بگویم دوران سلطه KNFB Reader به سر آمده است. نرم‌افزار “هوش مصنوعی بینا” که نخستین نسخه آن 12 ژوئیه (21 تیر) روانه بازار شد، به اندازه‌ای پر امکانات و هوشمند است که توجه سایت‌های مشهور در حوزه فناوری را نیز به خود جلب کرده است. علاوه بر آن، مجانی بودن Seeing AI هم بر جذابیت‌های محصول مایکروسافت می‌افزاید.

وقتی Seeing AI را باز می‌کنید، می‌توانید بر حسب نیازتان از یکی از کانال‌های تشخیصی نرم‌افزار بهره ببرید. در ادامه شما را با آن‌ها آشنا می‌کنم.

Short Text

کانال Short Text یا همان “متن کوتاه” که در KNFB Reader معادلی برای آن وجود ندارد، نخستین جذابیت Seeing AI است. به کمک این کانال می‌توانید گوشی را جلوی صفحه نمایش رایانه، بر روی صفحه نمایش پیانوهای دیجیتال، نوشته‌های مندرج بر روی جعبه‌های دارو و… بگیرید و به سرعت متون را بخوانید. در این حالت نیازی به عکس‌برداری هم وجود ندارد و همین به جذابیت‌های Seeing AI می‌افزاید. یعنی به محض مشاهده متن از طرف Seeing AI, گوشی شروع به خواندن می‌کند و اگر متن تغییر کند — مانند اتفاقی که در زمان به‌روزرسانی ویندوز رخ می‌دهد، متون جدید هم به طور خودکار خوانده می‌شوند. احساس استقلالی که هنگام استفاده از این کانال به کاربر دست می‌دهد قابل وصف نیست.

Document

همان طور که از نامش پیداست، کانال Document یا “پرونده” برای خواندن صفحات کتاب، مجلات و متون طولانی‌تر طراحی شده است. در این حالت باید از متن مورد نظرتان عکس بگیرید؛ اما کار با Seeing AI برای خواندن متون در قیاس با KNFB Reader بسیار آسان‌تر است. وقتی گوشی را بر روی متن حرکت می‌دهید، Seeing AI به طور خودکار به شما می‌گوید کدام بخش یا حاشیه از متن در کادر دوربین نیست. امکانی که در KNFB Reader تنها با گرفتن یک عکس آزمایشی برای Field of View Report و یا فعال کردن امکان Tilt Guidance در دسترس است. Seeing AI به محض دستیابی به بهترین زاویه گوشی و دوربین به شما می‌گوید دستتان را تکان ندهید و سپس خودش یک عکس از صفحه یا متن مورد نظر می‌گیرد؛ اتفاقی که در KNFB Reader باید فقط با انتخاب کاربر رخ دهد. البته کیفیت متون در هر دو نرم‌افزار بسیار مطلوب و شبیه یکدیگر است؛ اما اگر Seeing AI به شما متون بهتری تحویل ندهد که این اتفاق در مواردی هم به وضوح قابل مشاهده است، دست‌کم عکس گرفتن از صفحات با آن بسیار آسان‌تر و فرحبخش‌تر است. Seeing AI برای تشخیص متون در این کانال باید به اینترنت متصل شود. بدیهی است امکان تشخیص متون فارسی هم در هیچیک وجود ندارد.

Product

کانال Product یا “محصول” برای تشخیص بارکدهای مندرج بر روی محصولات است. تجربه‌ای از کار با این کانال Seeing AI ندارم و البته مشخص نیست این بخش از نرم‌افزار با محصولات ایرانی سازگار باشد یا خیر. اما در این حوزه هم Seeing AI امکانی را فراهم می‌کند که نرم‌افزار 100 دلاری KNFB Reader از ارائه آن عاجز است.

Person

هیچ دوربینی بدون توانایی عکس گرفتن از افراد کامل نیست. به همین دلیل، Seeing AI هم در کانال Person یا “شخص” خود می‌تواند به افراد دارای معلولیت بینایی کمک کند به آسانی از خودشان یا سایر افراد عکس بگیرند. KNFB Reader در این حوزه امکان مشابهی ندارد.

به محض وارد شدن صورت فرد به کادر دوربین، Seeing AI این وضع را به کاربر اعلام می‌کند و حتی موقعیت صورت فرد را بر روی صفحه نمایش، مثلاً وسط یا بالای صفحه، اعلام می‌کند. فاصله صورت فرد از لنز دوربین هم به طور گویا اعلام می‌شود؛ امکانی که دوربین iPhone آن را ندارد و تنها به اعلام تشخیص صورت افراد اکتفا می‌کند.

وقتی عملیات عکس‌برداری به پایان رسید، Seeing AI تلاش می‌کند سن فرد، جنسیت فرد، رنگ موی فرد و چگونگی صورت وی (خنثی، شاد، با عینک و…) را هم تشخیص و گزارش دهد. واضح است که ممکن است در تشخیص سن افراد اشتباهاتی هم رخ دهد که بروز آن‌ها تا حدودی به فاصله صورت افراد از دوربین بستگی دارد. (همین طور به باور شما آیا تلاش برای تشخیص سن خانم‌ها منطقی به نظر می‌رسد؟!)

از این شوخی که بگذریم، اگر شما از صورت فردی 3 بار عکس بگیرید و این عکس‌ها را با نام او ذخیره کنید، پس از آن و در هنگام حرکت دادن گوشی در یک اتاق یا هر مکانی که مد نظر شماست، می‌توانید با رسیدن به صورت وی بلافاصله نامش را هم بشنوید. با این امکان می‌توانید در صورت ارائه آموزش به Seeing AI, مثلاً بفهمید چه افرادی در یک اتاق یا یک جلسه حضور دارند.

Scene

کانال Scene یا “صحنه” هم که البته عنوان Beta یا “آزمایشی” را یدک می‌کشد به کاربر امکان می‌دهد با گرفتن عکس از محیط اطراف، با پیرامون خود آشنا شود. برای مثال، Seeing AI به شما می‌گوید لپ‌تاپی روی میز است، صندلی کنار پنجره قرار دارد، تلویزیون روشن است، 2 کتاب روی میز باز است، پسری روی تخت‌خواب نشسته است، و غیره. Seeing AI از این حیث به نرم‌افزار iDentifi شبیه می‌شود؛ با این تفاوت که سرعت و کیفیت تشخیص در Seeing AI بسیار بالاتر است. نرم‌افزار رایگان و کاربردی iDentifi که یک دانش‌آموز خلاق در کانادا آن را نوشته است، همچنین ماه‌هاست به‌روز نشده است.

حال که صحبت از شناسایی محیط و اشیاء به میان آمد، بد نیست به این نکته هم اشاره کنم که اگر به این حوزه علاقمند هستید، می‌توانید به سراغ نرم‌افزارهایی مانند Aipoly Vision و TapTapSee هم بروید؛ اما تجربه شخصی من نشان می‌دهد محصول مایکروسافت در این حوزه عملکرد بهتری دارد و دست‌کم مانند Aipoly Vision, “لپ‌تاپ” را “گربه” تشخیص نمی‌دهد!

سایر امکانات Seeing AI

یکی دیگر از امکانات Seeing AI, دریافت تصاویر از سایر برنامه‌ها به کمک ابزار Sharing یا “اشتراک‌گذاری” است. با این امکان می‌توانید تصاویر افراد و صفحات اسکن‌شده از متون در سایر نرم‌افزارها را به Seeing AI ارسال کنید. همچنین می‌توانید تصاویر و متون موجود در Seeing AI را به کمک همان ابزار “Sharing” با سایر برنامه‌ها و شبکه‌های اجتماعی به اشتراک بگذارید. هر یک از کانال‌های Seeing AI هم آموزش ویدئویی و متنی مخصوص به خودش را دارد که به آسانی قابل استفاده است.

مخلص کلام

چنان که در توضیح Seeing AI در بازار نرم‌افزار اپل آمده است:

Seeing AI برای کمک به موفقیت بیشتر شما به مدد قدرت ابر و هوش مصنوعی طراحی شده است. با پیشرفت این پژوهش، ممکن است کانال‌های جدید هم به آن اضافه شود.

به عنوان فردی که روزانه از نرم‌افزارهای Be My Eyes و BeSpecular استفاده می‌کنم و هر بار که یکی از مشکلاتم به کمک آن‌ها حل می‌شود در شگفتی عجیبی غرق می‌شوم، تصور نمی‌کردم نرم‌افزاری مانند Seeing AI بتواند تا این اندازه شگفت‌انگیز، جذاب و هوشمند باشد؛ آن هم بدون دریافت یک ریال از کاربر. به هر حال وقتی شرکتی بزرگ مانند مایکروسافت به یک عرصه خاص وارد می‌شود، باید انتظار نرم‌افزارهایی با‌کیفیت را هم داشت. اتفاقی که هنگام کار با نسخه‌های جدید ویندوز 10 هم به خوبی نمایان است.

شاید گام بعدی مایکروسافت در این حوزه، گسترش Seeing AI به اندروید باشد. گزارش‌هایی هم درباره اضافه شدن امکاناتی مانند تشخیص پول در قالب یک کانال انحصاری به Seeing AI در توییتر منتشر شده است. پس باید منتظر ماند و دید گذشت زمان برای Seeing AI چه سرنوشتی رقم می‌زند.

درباره امیر‌حسین سلیمانی

درود. عضوی از محله گوش‌کن هستم، نابینای مطلق، متولد یکی از آخرین روزهای اسفند 59. فارغ‌التحصیل زبان و ادبیات انگلیسی و آموزش زبان انگلیسی در مقاطع کارشناسی و کارشناسی ارشد از دانشگاه علامه طباطبایی هستم. در دهه‌های 70 و 80 سابقه همکاری با روزنامه ایران‌سپید و مرکز نابینایان رودکی رو داشتم. حالا در بخش بین‌الملل صدا‌و‌سیما به عنوان مترجم مشغول به کارم. پیش‌تر هم در همین سازمان در بخش اخبار رادیو به عنوان مترجم و گزارشگر حضور داشتم و با برنامه پیک بامدادی همکاری کردم. مدتی هم سردبیر بخش بین‌الملل باشگاه خبرنگاران جوان بودم. این بود، یا شاید بهتر باشه بگم این هست شناسنامه نه‌چندان مرتب و منظم من.
این نوشته در آیفون, اخبار, اطلاع رسانی, تلفن همراه, نرم افزار های کاربردی ارسال و , , , , , , , , برچسب شده است. افزودن پیوند یکتا به علاقه‌مندی‌ها.

54 Responses to مایکروسافت با نرم‌افزار شگفت‌انگیز Seeing AI به کمک نابینایان آمد

  1. 1
    علاء الدین says:

    سلام! ای کاش چنین نرم‌افزاری متناسب با متون و محصولات ایرانی و در واقع متناسب با نیازهای فارسی‌زبانان طراحی و تولید شود. درهرحال متشکرم از تلاش و آگاهی‌بخشی شما.

  2. 2

    درود. واقعاً کیف کردم. ایول. مرسی از اشتراکش. ما هم که به امید زنده ایم, و امیدواریم فارسی هم بهش اضافه بشه, هر چند آرزوی پوکیه خَخ.

  3. 3

    سلام
    ی سوال دارم: من میخوام یک گوشی اپل بخرم باید از چ صفحه خوانی استفاده کنم برای زبان فارسی؟

    • 3.1
      امیر‌حسین سلیمانی says:

      درود. برای زبان فارسی موتور صوتی نداره. تنها راه، استفاده از موتور صوتی عربی VoiceOver برای خوندن متون فارسی، اون هم به شکل محدود و فقط برای پیامک، ای‌میل و جی‌پی‌اس هست.

  4. 4

    سلام.
    تشكر ميكنم از خبر عاليتون.
    ايميل سازندگانش رو اينجا بذارين من هم ازشون تشكر كنم هم درخواست كنم كه فارسي هم بهش اضافه بشه.
    راستي چطوري ميتونم با راديوهاي برون مرزي همكاري داشته باشم؟
    راديو انگليسي باهام مصاحبه ميكنن و اتفاقا امروزم يكيش پخش ميشه اما ميخوام كتابهاي مورد نظرم رو بخونم ضبط كنم بفرستم براشون.

  5. 5

    سلام مجدد
    ویندز فون چی؟ متون فارسی رو با چ برنامه ای میشه خوند؟

    • 5.1
      امیر‌حسین سلیمانی says:

      ویندوز فون فعلاً فقط نریتور رو داره و امکان نصب موتور صوتی اضافی هم نداره. ضمن این که با توجه به کمبود نرم‌افزار کاربردی برای ویندوز فون، خرید گوشی‌های اندکی که به این سیستم‌عامل مجهز هستن اصلاً توصیه نمی‌شه.

  6. 6
    محمد عسکری says:

    سلام! خیلی ممنون از پست و مطلب مفیدتون. موفق باشید!

  7. 7

    سلام.
    خوش به حال آیفون دارا. اگه یه درصد حدث میزدم اپلیکیشن files تو Ios 11 کارایی داره حتما میرفتم سراغ آیفون. چون بیشترین مشکلم با محدودیتهای این شکلیشه.
    seeing AI خیلی عالیه. ممنون از این که تجربه هاتونو به اشتراک گذاشتید.

  8. 8

    باید اونقدر شارژ از 780 بخرم تا بالاخره توی قرعه کشی هفتگیش یه بار یه آیفون برنده بشم. بدجور وسوسه انگیزه امیر جان!
    تنظیم خبر واقعا عالی و حرفه ای بود.
    ممنون که حواست به اینجا هم هست!

  9. 9
    احمد عبدالله پور says:

    سلام و درود بر آقای سلیمانی گرامی
    خوبید استاد
    خب این متنی که شما گذاشتید خیلی تخصصی و فنی بود حالا باید دوباره بخونمش ببینم چی گفته
    استاد خیلی مخلصیم
    روزتون خوش و خدا نگهدار

  10. 10
    امید هاشمی says:

    ارادت امیر خان. شاید بد نبود اشاره‌ای هم به این می‌شد که این اپلیکیشن فعلاً فقط برای Iphone به دست‌های آمریکا، کانادا، سنگاپور، نیوزیلند و هنگ کنگ قابل دانلود خواهد بود. البته بنده اطلاعی از راه‌های احتمالی دور زدنِ این محدودیت ندارم.

    • 10.1
      امیر‌حسین سلیمانی says:

      امید جان ارادت. آقا ببینیمت!
      تغییر App Store تنها راه ساده دور زدن محدودیتی هست که به اون اشاره کردی؛ اما این راهکار مشکلات خودش رو هم داره. برای افرادی مثل ما که از App Store آمریکا استفاده می‌کنیم که البته مشکلی نیست.

  11. 11
    ندا says:

    سلام از اطلاعات خوبی که در اختیارمون گذاشتید بی نهایت ممنونم.

  12. 12
    خورشید خانم says:

    سلام, مطلب جالبی بود, فقط کاش ی فکری ام به حال ما فارسی زبانا میشد, سپاس از لطفتون

  13. 13
    سعید says:

    درود و سپاس از اطلاع رسانی مفیدتان فقط میتوانم بگویم جل الخالق .

  14. 14
    کاربر 2211 says:

    سلام بسیار جالب بود. تشکر. یه سوال: نرم افزار اندرویدی وجود دارد که مانند این نرم افزار آن را بر روی نوشته های اشیا گرفت و سریع برامون بخونه؟!

  15. 15

    در یک کلام آلیه! آلیه! آلیه!
    روی آیفون6s تست کردم! اونقد شگفت زده شدم از عسر تا به حال که هنوز رو شُک موندم!
    با دوربین رابطه مستقیم داره! پس از 5اس پایین تر فایده نمیده.
    نگاه نکردم ببینم چه ios میخواد ولی زیر 5اس اصلن تست هم نکنید چون نتیجه زیاد جالب نخواهد شد!
    ساعالی بود در خدمتم!

    • 15.1
      امیر‌حسین سلیمانی says:

      درود. خوشحالم دست‌کم یک نفر از خوانندگان موفق به آزمایش این نرم‌افزار شد.
      تنها محدودیتی که به طور رسمی اعلام شده، دسترسی به کانال محصول یا بارکد هست که برای گوشی‌های پایینتر از 6 در دسترس نیست. ولی به طور کلی پیشنهاد شده از آیفون 6 به بالا استفاده بشه.

  16. 16
  17. 17

    سلام جناب سلیمانی. پست شما رو مطالعه کردم و فقط خواستم صمیمانه تشکر کنم. پیروز باشید.

  18. 18
    همیشه بهار says:

    سلام بسیار عالی بود. خوندن هم‌چین مطالبی هم باعث خوشحالیه و هم تاسف. خوشحالی بابت این که هر روز یه چیز جدیدی زندگی ما را بهتر می‌کنه و تاسف از این که ما ایرانی‌ها و کلا فارسی زبان‌ها همیشه چند پله از قافله عقب هستیم.
    باز هم بابت مطلب خوبتون ممنون

    • 18.1
      امیر‌حسین سلیمانی says:

      سلام و سپاس از لطف شما.
      کاملاً حق با شماست.
      این که هنوز برای زبان فارسی به معنای واقعی “تی تی اس” و “او سی آر” طراحی نشده، و این که نبود این دو راهکار مهم به سایر پروژه‌های پژوهشی درباره زبان فارسی آسیب وارد می‌کنه جای تأسف هست.
      البته گوگل برای او سی آر فارسی گام‌های خوبی برداشته و کمپانی ABBYY — سازنده FineReader هم او سی آر فارسی داره؛ ولی دسترسی به اون‌ها در قالبی سهل‌الوصول دشوار هست.

  19. 19
    همیشه بهار says:

    آقای سلیمانی می‌تونم خواهش کنم در مورد دو تا نرم‌افزاری که توی متن اسم بردید هم توضیحاتی بدید. منظورم اون دو تا نرم‌افزاریه که با کلمه “Be” شروع شدند.

    • 19.1
      امیر‌حسین سلیمانی says:

      بله حتماً.
      نرم‌افزار Be My Eyes به کاربر امکان می‌ده از طریق برقراری ارتباط ویدئویی با یکی از داوطلبان که از افراد بینا تشکیل می‌شن، به حل مشکلاتش بپردازه. می‌تونید در این برنامه یک تماس ایجاد کنید. بعد یکی از داوطلب‌ها به تماس شما پاسخ می‌ده و از طریق دوربین گوشی آیفون، محیط اطراف شما رو می‌بینه. برای مثال، شما می‌تونید از اون فرد درخواست کنید نوشته روی داروها، صفحه نمایش کامپیوتر، و… رو براتون بخونه، رنگ لباس‌های شما رو اعلام کنه، در فروشگاه به شما کمک کنه اجناس مورد نظرتون رو انتخاب کنید، بهتون درباره موانع موجود در یک پیاده‌رو توضیح بده، و خلاصه درباره هر موضوعی که به نوعی به بینایی نیاز داره به شما کمک کنه. Be My Eyes در حال حاضر حدود 512 هزار داوطلب در نقاط مختلف جهان داره. همچنین امکان مطرح کردن پرسش به یک زبان خاص در این برنامه در نظر گرفته شده. این هم سایتش: http://bemyeyes.com/
      BeSpecular هم عملکردی شبیه به Be My Eyes داره؛ با این تفاوت که به جای برقراری ارتباط مستقیم ویدئویی با یک داوطلب، شما از شیئی که مد نظرتون هست عکس می‌گیرید و اون عکس رو برای داوطلبان ارسال می‌کنید. همچنین می‌تونید در کنار اون عکس، یک پیام صوتی یا متنی بفرستید. داوطلب‌ها عکس و پرسش صوتی یا متنی مورد نظر شما رو دریافت می‌کنن، و شما هم به جای یک پاسخ، چندین پاسخ از چندین داوطلب دریافت می‌کنید. سایتش هم هست http://www.bespecular.com
      امیدوارم پاسخ من مورد قبول شما واقع بشه.

  20. 20
    ابوذر says:

    باسلام.
    اینکه یه نرم افزار بتونه همچین امکاناتی رو در اختیار آدم قرار بده واقعا رویایی و مسحور کنندست. خوب راستش من آرزو ندارم که نسخه اندروید این نرم افزار به بازار بیاد! چون معمولا نسخه اندروید در مقایسه با IOS جدا مثل اسباب بازی هستش. این رو کسانی که با آیفن کار کردن خوب میدونن. ای کاش اپل از زبان فارسی در voice over پشتیبانی کنه و شرکت های داخلی هم به جای سرمایه گذاری های بی هوده در اندروید، به سمت IOS هم نگاهی داشته باشند. البته این پشتیبانی بخش دولتی و نیز خواست ما ها رو هم نیاز داره. چند سال قبل بنده با کمک آقای اسدی کمپینی برای جلب حمایت Apple جهت پشتیبانی از زبان فارسی در TTS راه انداختیم اما متاسفانه Apple توجهی نکرد.
    در اوصاف آیفن باید بگم اگر به آیفن بگیم گوشی، به سامسونگ و سایر اندرویدی ها اسباب بازی هم نمیشه گفت. جدا بدون اغراق گفتم.

    • 20.1
      امیر‌حسین سلیمانی says:

      سلام. ممنون از توجه شما.
      با بخش زیادی از گفته‌های شما موافقم گرچه گذاشتن نام اسباب‌بازی بر روی گوشی‌های اندرویدی، دست‌کم بر روی برخی از پرچم‌دارهای اندروید، کمی بی‌انصافی هست.

  21. 21
    manchester says:

    با سلام،
    به عنوان یک نابینا، به وجود نابینایی مثل شما افتخار می کنم.
    امتحان کردم و تا چند دقیقه هنگ هنگ بودم.
    ممنون از اطلاع رسانی به موقع شما

  22. 22

    سلام امیرخان.
    بیشک از خبرنگار و مترجمی چون شما که سالهاست در حوزه تکنولوژی های روز مطالعه داره، تنظیم اینچنینی هم انتظار میره.
    هر چند پنج روز پیش خبر این اپلیکیشن فوق العاده رو در وبسایت پکتوس برای مخاطبانمون ترجمه و منتشر کردیم، اما حقیقتاً از اطلاعات کاملی که توسط شما در این پست عرضه شد لذت بردم.
    ارادت فراووون.

    • 22.1
      امیر‌حسین سلیمانی says:

      امیر جان ارادت فراوان، و به گفته دست‌کم یکی از اعضای همین وبسایت، این یک تعارف نیست!
      پیگیری و پوشش اخبار مرتبط با افراد دارای معلولیت بینایی از طرف شما قابل تقدیر هست.

  23. 23

    لطف داری امیر عزیز.
    یک نکته هم یادم رفت بگم، البته که در هر شرایطی باید امیدوار باشیم، اما دست کم در این مورد خاص اینکه اپل بخواد از زبان فارسی در میان موتور های صوتیش پشتیبانی کنه، چندان امیدی ندارم.
    به چندین دلیل.
    یکی اینکه هنوز هیچ اراده ای از طرف اپل در این ارتباط مشاهده نشده.
    نکته ی دوم اینکه هیچ کدوم یک از tts های فعلی فارسی، استاندارد های لازم رو ندارن تا توسط شرکت های معتبر پشتیبانی بشن.
    بازار محدود فروش هم از دیگر نکاتیه که باعث شده امثال اپل، هیچ تمایلی برای سرمایه گذاری در این بخش نداشته باشن.
    اگه میبینیم در اندروید هم وجود داره، به خاطر متنباز بودن این سیستم عامل و توسعه دهنده های فراوانیه که اندروید داره.
    بنابر این، از اونجایی که هیچ یک از زمینه های لازم برای پشتیبانی اپل از tts فارسی هنوز فراهم نیست، شخصاً خوشبین نیستم حالا حالا ها این اتفاق بیفته.
    تا تحلیل و ارزیابی شما در این ارتباط چی باشه.

    • 23.1
      امیر‌حسین سلیمانی says:

      امیر جان با نظرت موافقم.
      البته این که آی‌اواس از موتور صوتی و صدا‌های فارسی پشتیبانی نمی‌کنه بیش از این که به اپل مربوط باشه، به کمپانی Nuance مربوط هست که هنوز برای زبان فارسی اقدامی انجام نداده. بیش از 80 درصد از صداهای آی‌اواس به وسیله Nuance تولید می‌شن — همون صداهای Vocalizer, و اپل فقط صدا‌های Siri و Alex رو خودش تولید می‌کنه. اگر زمانی در Nuance برای تولید موتور صوتی یا صدای فارسی اراده ای ایجاد بشه، بعد می‌شه از اپل انتظار داشت از اون صدا در آی‌اواس استفاده کنه.
      نکته بسیار تأسف‌بار این هست که بعد از این همه سال و صرف این همه هزینه، همون طور که خودت گفتی، هیچ یک از موتورهای صوتی فارسی از استانداردهای لازم برای گنجانده شدن در محصولات اپل و حتی گوگل برخوردار نیستن. عجیب نیست که در اندروید، تنها گزینه کاربردی برای زبان فارسی هنوز eSpeak هست — با تمام اشکالاتی که داره و صدای رباتیکی که تولید می‌کنه.
      با سپاس.

  24. 24

    ثلام استاد مطلب فوق مفید و امیدبخشی بود. متشکرم

  25. 25
    شادمهر says:

    seeing شگفت زده شدم
    درود جناب امیر حسین جان بسیار ممنون از تحقیق مو شکافانتون در خصوص این پدیده
    حالا بغیر از جناب سرمدی که من به ایشون لقب tk رو داده بودم حالا باید امیر به توان دو tk رو اضاف کنم
    روشی رو که با گرفتن دوربین گوشی بر روی جعبه دارو و یا هر نوشته دیگه که بلافاصله متن رو میخونه جالب بود من این نوع خواندن رو در برنامه قدم که سال 1391 از شبکه تیوی پرشیا پخش میشد و با یک آقای کم بینا آلمانی مصاحبه می کردن دیدم که یه دستگاه داشت که روی سیدی و یا چیزهای دیگه میگرفت و پس از خواندن وسیله مورد نظرش رو از میان وسیله ها پیدا می کرد بود
    به نظر من امیرجان بهزیستی و دولت و حکومت که حاضر نیستن توجه ای به کمبود ها و نیاز های ما در بخش تکنولژی بکنند یا بودجه ای رو برای این کار جهت پیشرفت ما و هم گام شدن با تمام دنیا تحت اختیار شرکت های خارجی قرار بدن
    پس تنها راه ما تلاش خودمان هست که همون مثال قطره قطره جمع گردد…
    خانم آیت اولین نفر بود و دیگر دوستان هم که زبان خوبی دارند به دنبال ایشون باید از طریق ایمیل و هر راه ارتباط دیگری که وجود دارد باید پیگیر بشیم و خواسته خودمان رو بر آنها تحمیل کنیم شاید زمان بر باشه ولی امکان پذیر هست
    چون خوده من به همراه چند نفر دیگه در بخش کیبورد یاماها بالاخره تونستیم درصد زیادی از کمبود های دستگاه رو برطرف کنیم با وجود موانعی که نماینده ایرانی یاماها سر راهمون می گذاشت بعد از 4سال موفق شدیم و حالا در ادامه منتظر نتیجه کارهامون در کیبورد جدیدش بنام تایرس6 هستیم
    شنیدم پیانو کار می کنید اگر در خصوص خرید کاری از دستم بر بیاد در خدمتم
    و بسیار خورسند از آشنایی با شما

  26. 26
    امیر‌حسین سلیمانی says:

    ممنون از لطف شما شادمهر عزیز.
    درباره حل مشکلات خودمون و زبان فارسی هم فکر می‌کنم اگر یک ان‌جی‌او یا نهادی قوی‌تر در حوزه نابینایان داشته باشیم، حتماً صدای ما در جهان بهتر شنیده می‌شه. متأسفانه دغدغه مراکز ویژه نابینایان در کشور، البته اگر بشه اون‌ها رو با تعاریف بین‌المللی ان‌جی‌او بدونیم، مسائل دیگری هست. جالب اینجاست که افراد دارای معلولیت شنوایی و جسمی-‌حرکتی از این حیث شرایط بهتری نسبت به نابینایان دارن.
    درباره پیانو هم حتماً مزاحمتون می‌شم. البته من در این حوزه تازه‌کار هستم و کمتر از 1 سال هست که تلاش می‌کنم دستی بر آتش داشته باشم. اتفاقاً یک پیانوی دیجیتال یاماها دارم و از امکاناتش راضی هستم؛ ولی کار با منوهای دستگاه به دلیل گویا نبودنشون ساده نیست.

دیدگاهتان را بنویسید