مقدمه
اگر کاربر سیستمعامل آیاواس اپل یا اندروید گوگل باشید، حتماً دستکم یک نرمافزار او سی آر یا همان تشخیص نوری حروف و مبدل تصویر به متن را روی تلفن همراهتان نصب کردهاید. این نرمافزارها به کاربران امکان میدهند با گرفتن عکس از یک صفحه کتاب، مجله یا هر نوشتهای که در اختیار دارند، متون مندرج در آن را با قابلیت ویرایش دریافت کنند.
شاید نخستین نرمافزاری که در سالیان اخیر با ورودش به فروشگاه نرمافزار اپل توانست تبدیل تصاویر به متون را برای افراد دارای معلولیت بینایی به گونهای جدیتر و حرفهایتر مطرح کند، KNFB Reader بود. بعدها نسخه اندرویدی آن هم روانه بازار شد؛ اما، اگر از تخفیفهای گاه و بیگاه آن بگذریم، پرداخت حدود 100 دلار برای خرید این نرمافزار از عهده بسیاری از کاربران خارج است. البته ذکر این نکته هم خالی از لطف نیست که حتی در سال 2008 و پیش از ظهور اپل و گوگل به عنوان بازیگران اصلی در حوزه تلفنهای همراه هوشمند، امکان استفاده از این نرمافزار برای گوشی Nokia N82 فراهم شده بود. برای کسب اطلاعات بیشتر، به این صفحه فروش محصول و این مقاله جالب رجوع کنید.
به هر حال، گذشت زمان سبب شد جدا از KNFB Reader با نرمافزارهای دیگری هم در این حوزه آشنا شویم. حالا یکی از جذابترین آنها — که البته هنوز نسخه اندرویدی ندارد، Seeing AI: Talking Camera for the Blind است. میتوان آن را “هوش مصنوعی بینا: دوربین گویا برای نابینایان” هم ترجمه کرد.
نرمافزار Seeing AI چه قابلیتهای ویژهای دارد؟
کوتاه و مختصر، اغراق نیست اگر بگویم دوران سلطه KNFB Reader به سر آمده است. نرمافزار “هوش مصنوعی بینا” که نخستین نسخه آن 12 ژوئیه (21 تیر) روانه بازار شد، به اندازهای پر امکانات و هوشمند است که توجه سایتهای مشهور در حوزه فناوری را نیز به خود جلب کرده است. علاوه بر آن، مجانی بودن Seeing AI هم بر جذابیتهای محصول مایکروسافت میافزاید.
وقتی Seeing AI را باز میکنید، میتوانید بر حسب نیازتان از یکی از کانالهای تشخیصی نرمافزار بهره ببرید. در ادامه شما را با آنها آشنا میکنم.
Short Text
کانال Short Text یا همان “متن کوتاه” که در KNFB Reader معادلی برای آن وجود ندارد، نخستین جذابیت Seeing AI است. به کمک این کانال میتوانید گوشی را جلوی صفحه نمایش رایانه، بر روی صفحه نمایش پیانوهای دیجیتال، نوشتههای مندرج بر روی جعبههای دارو و… بگیرید و به سرعت متون را بخوانید. در این حالت نیازی به عکسبرداری هم وجود ندارد و همین به جذابیتهای Seeing AI میافزاید. یعنی به محض مشاهده متن از طرف Seeing AI, گوشی شروع به خواندن میکند و اگر متن تغییر کند — مانند اتفاقی که در زمان بهروزرسانی ویندوز رخ میدهد، متون جدید هم به طور خودکار خوانده میشوند. احساس استقلالی که هنگام استفاده از این کانال به کاربر دست میدهد قابل وصف نیست.
Document
همان طور که از نامش پیداست، کانال Document یا “پرونده” برای خواندن صفحات کتاب، مجلات و متون طولانیتر طراحی شده است. در این حالت باید از متن مورد نظرتان عکس بگیرید؛ اما کار با Seeing AI برای خواندن متون در قیاس با KNFB Reader بسیار آسانتر است. وقتی گوشی را بر روی متن حرکت میدهید، Seeing AI به طور خودکار به شما میگوید کدام بخش یا حاشیه از متن در کادر دوربین نیست. امکانی که در KNFB Reader تنها با گرفتن یک عکس آزمایشی برای Field of View Report و یا فعال کردن امکان Tilt Guidance در دسترس است. Seeing AI به محض دستیابی به بهترین زاویه گوشی و دوربین به شما میگوید دستتان را تکان ندهید و سپس خودش یک عکس از صفحه یا متن مورد نظر میگیرد؛ اتفاقی که در KNFB Reader باید فقط با انتخاب کاربر رخ دهد. البته کیفیت متون در هر دو نرمافزار بسیار مطلوب و شبیه یکدیگر است؛ اما اگر Seeing AI به شما متون بهتری تحویل ندهد که این اتفاق در مواردی هم به وضوح قابل مشاهده است، دستکم عکس گرفتن از صفحات با آن بسیار آسانتر و فرحبخشتر است. Seeing AI برای تشخیص متون در این کانال باید به اینترنت متصل شود. بدیهی است امکان تشخیص متون فارسی هم در هیچیک وجود ندارد.
Product
کانال Product یا “محصول” برای تشخیص بارکدهای مندرج بر روی محصولات است. تجربهای از کار با این کانال Seeing AI ندارم و البته مشخص نیست این بخش از نرمافزار با محصولات ایرانی سازگار باشد یا خیر. اما در این حوزه هم Seeing AI امکانی را فراهم میکند که نرمافزار 100 دلاری KNFB Reader از ارائه آن عاجز است.
Person
هیچ دوربینی بدون توانایی عکس گرفتن از افراد کامل نیست. به همین دلیل، Seeing AI هم در کانال Person یا “شخص” خود میتواند به افراد دارای معلولیت بینایی کمک کند به آسانی از خودشان یا سایر افراد عکس بگیرند. KNFB Reader در این حوزه امکان مشابهی ندارد.
به محض وارد شدن صورت فرد به کادر دوربین، Seeing AI این وضع را به کاربر اعلام میکند و حتی موقعیت صورت فرد را بر روی صفحه نمایش، مثلاً وسط یا بالای صفحه، اعلام میکند. فاصله صورت فرد از لنز دوربین هم به طور گویا اعلام میشود؛ امکانی که دوربین iPhone آن را ندارد و تنها به اعلام تشخیص صورت افراد اکتفا میکند.
وقتی عملیات عکسبرداری به پایان رسید، Seeing AI تلاش میکند سن فرد، جنسیت فرد، رنگ موی فرد و چگونگی صورت وی (خنثی، شاد، با عینک و…) را هم تشخیص و گزارش دهد. واضح است که ممکن است در تشخیص سن افراد اشتباهاتی هم رخ دهد که بروز آنها تا حدودی به فاصله صورت افراد از دوربین بستگی دارد. (همین طور به باور شما آیا تلاش برای تشخیص سن خانمها منطقی به نظر میرسد؟!)
از این شوخی که بگذریم، اگر شما از صورت فردی 3 بار عکس بگیرید و این عکسها را با نام او ذخیره کنید، پس از آن و در هنگام حرکت دادن گوشی در یک اتاق یا هر مکانی که مد نظر شماست، میتوانید با رسیدن به صورت وی بلافاصله نامش را هم بشنوید. با این امکان میتوانید در صورت ارائه آموزش به Seeing AI, مثلاً بفهمید چه افرادی در یک اتاق یا یک جلسه حضور دارند.
Scene
کانال Scene یا “صحنه” هم که البته عنوان Beta یا “آزمایشی” را یدک میکشد به کاربر امکان میدهد با گرفتن عکس از محیط اطراف، با پیرامون خود آشنا شود. برای مثال، Seeing AI به شما میگوید لپتاپی روی میز است، صندلی کنار پنجره قرار دارد، تلویزیون روشن است، 2 کتاب روی میز باز است، پسری روی تختخواب نشسته است، و غیره. Seeing AI از این حیث به نرمافزار iDentifi شبیه میشود؛ با این تفاوت که سرعت و کیفیت تشخیص در Seeing AI بسیار بالاتر است. نرمافزار رایگان و کاربردی iDentifi که یک دانشآموز خلاق در کانادا آن را نوشته است، همچنین ماههاست بهروز نشده است.
حال که صحبت از شناسایی محیط و اشیاء به میان آمد، بد نیست به این نکته هم اشاره کنم که اگر به این حوزه علاقمند هستید، میتوانید به سراغ نرمافزارهایی مانند Aipoly Vision و TapTapSee هم بروید؛ اما تجربه شخصی من نشان میدهد محصول مایکروسافت در این حوزه عملکرد بهتری دارد و دستکم مانند Aipoly Vision, “لپتاپ” را “گربه” تشخیص نمیدهد!
سایر امکانات Seeing AI
یکی دیگر از امکانات Seeing AI, دریافت تصاویر از سایر برنامهها به کمک ابزار Sharing یا “اشتراکگذاری” است. با این امکان میتوانید تصاویر افراد و صفحات اسکنشده از متون در سایر نرمافزارها را به Seeing AI ارسال کنید. همچنین میتوانید تصاویر و متون موجود در Seeing AI را به کمک همان ابزار “Sharing” با سایر برنامهها و شبکههای اجتماعی به اشتراک بگذارید. هر یک از کانالهای Seeing AI هم آموزش ویدئویی و متنی مخصوص به خودش را دارد که به آسانی قابل استفاده است.
مخلص کلام
چنان که در توضیح Seeing AI در بازار نرمافزار اپل آمده است:
Seeing AI برای کمک به موفقیت بیشتر شما به مدد قدرت ابر و هوش مصنوعی طراحی شده است. با پیشرفت این پژوهش، ممکن است کانالهای جدید هم به آن اضافه شود.
به عنوان فردی که روزانه از نرمافزارهای Be My Eyes و BeSpecular استفاده میکنم و هر بار که یکی از مشکلاتم به کمک آنها حل میشود در شگفتی عجیبی غرق میشوم، تصور نمیکردم نرمافزاری مانند Seeing AI بتواند تا این اندازه شگفتانگیز، جذاب و هوشمند باشد؛ آن هم بدون دریافت یک ریال از کاربر. به هر حال وقتی شرکتی بزرگ مانند مایکروسافت به یک عرصه خاص وارد میشود، باید انتظار نرمافزارهایی باکیفیت را هم داشت. اتفاقی که هنگام کار با نسخههای جدید ویندوز 10 هم به خوبی نمایان است.
شاید گام بعدی مایکروسافت در این حوزه، گسترش Seeing AI به اندروید باشد. گزارشهایی هم درباره اضافه شدن امکاناتی مانند تشخیص پول در قالب یک کانال انحصاری به Seeing AI در توییتر منتشر شده است. پس باید منتظر ماند و دید گذشت زمان برای Seeing AI چه سرنوشتی رقم میزند.
۵۴ دیدگاه دربارهٔ «مایکروسافت با نرمافزار شگفتانگیز Seeing AI به کمک نابینایان آمد»
سلام! ای کاش چنین نرمافزاری متناسب با متون و محصولات ایرانی و در واقع متناسب با نیازهای فارسیزبانان طراحی و تولید شود. درهرحال متشکرم از تلاش و آگاهیبخشی شما.
سلام. به هر حال باید پذیرفت درباره زبان فارسی پژوهشهای کمتری انجام شده — چه در بحث موتور صوتی و چه در بحث مبدل متن به صوت. باید به آینده امیدوار بود.
درود. واقعاً کیف کردم. ایول. مرسی از اشتراکش. ما هم که به امید زنده ایم, و امیدواریم فارسی هم بهش اضافه بشه, هر چند آرزوی پوکیه خَخ.
درود. من هم مثل شما امیدوارم. شاید در آینده نزدیک محقق نشه؛ ولی در میانمدت اصلاً محال نیست.
سپاس از توجه شما.
سلام
ی سوال دارم: من میخوام یک گوشی اپل بخرم باید از چ صفحه خوانی استفاده کنم برای زبان فارسی؟
درود. برای زبان فارسی موتور صوتی نداره. تنها راه، استفاده از موتور صوتی عربی VoiceOver برای خوندن متون فارسی، اون هم به شکل محدود و فقط برای پیامک، ایمیل و جیپیاس هست.
سلام.
تشکر میکنم از خبر عالیتون.
ایمیل سازندگانش رو اینجا بذارین من هم ازشون تشکر کنم هم درخواست کنم که فارسی هم بهش اضافه بشه.
راستی چطوری میتونم با رادیوهای برون مرزی همکاری داشته باشم؟
رادیو انگلیسی باهام مصاحبه میکنن و اتفاقا امروزم یکیش پخش میشه اما میخوام کتابهای مورد نظرم رو بخونم ضبط کنم بفرستم براشون.
با سلام و تشکر از توجه شما.
ایمیل که ندارن؛ اما اگر از توییتر استفاده میکنید، میتونید از این صفحه با تیم دسترسپذیری مایکروسافت در تماس باشید:
https://twitter.com/MSFTEnable?ref_src=twsrcEgoogleCtwcampEserpCtwgrEauthor
این هم وبسایت پروژه Seeing AI که در انتهای متن بهش اشاره کردم:
https://www.microsoft.com/en-us/seeing-ai
درباره رادیوهای برونمرزی هم متأسفانه اطلاع ندارم چون با اونها کار نمیکنم. اما اگر راه تماس با اونها رو دارید (که برای یکی از رادیوها ظاهراً این اتفاق افتاده)، از همون روش درخواست خودتون رو مطرح کنید.
بله ارتباط که باهاشون دارم و رادیو انگلیسی چند بار باهام مصاحبه داشتن و احتمال زیاد امروزم یکیش پخش شده.
با سایت مایکروسافتم میتونم تماس بگیرم؟
بخش تماس با ما دارن؟
چون من توییتر و فیلتِرشکن ندارم.
بله دارن، ولی دردسرش زیاده. به اینجا سر بزنید:
https://go.microsoft.com/?linkid=2028325
سلام مجدد
ویندز فون چی؟ متون فارسی رو با چ برنامه ای میشه خوند؟
ویندوز فون فعلاً فقط نریتور رو داره و امکان نصب موتور صوتی اضافی هم نداره. ضمن این که با توجه به کمبود نرمافزار کاربردی برای ویندوز فون، خرید گوشیهای اندکی که به این سیستمعامل مجهز هستن اصلاً توصیه نمیشه.
سلام! خیلی ممنون از پست و مطلب مفیدتون. موفق باشید!
سلام. ممنون از توجه شما.
سلام.
خوش به حال آیفون دارا. اگه یه درصد حدث میزدم اپلیکیشن files تو Ios 11 کارایی داره حتما میرفتم سراغ آیفون. چون بیشترین مشکلم با محدودیتهای این شکلیشه.
seeing AI خیلی عالیه. ممنون از این که تجربه هاتونو به اشتراک گذاشتید.
سلام علی آقا. فعلاً که صحبت از Files فقط برای iPad هست. ولی بعید نیست اپل اون رو برای iPhone هم عرضه کنه.
ممنون از لطفت.
باید اونقدر شارژ از ۷۸۰ بخرم تا بالاخره توی قرعه کشی هفتگیش یه بار یه آیفون برنده بشم. بدجور وسوسه انگیزه امیر جان!
تنظیم خبر واقعا عالی و حرفه ای بود.
ممنون که حواست به اینجا هم هست!
مجتبی جان ممنون که با گذشت چند سال، برای من امکان انتشار مستقیم مطالب در وبسایت پرمخاطب شما هنوز فراهم هست.
تلاش میکنم اینجا بیشتر بنویسم.
درباره آیفون هم کاملاً حق داری. تا اندازه ای که چند ماه پیش گوشی نکسوس ۶P خودم رو فروختم و بعید بدونم به این زودیها سراغی از اندروید بگیرم. البته نیاز به اندروید برای زبان فارسی رو کاملاً درک میکنم.
خواهش. هر کاری کردم وظیفه بوده امیر جان. ارزشت بیشتر از این حرفاست.
لطف داری آقا مجتبی.
سلام و درود بر آقای سلیمانی گرامی
خوبید استاد
خب این متنی که شما گذاشتید خیلی تخصصی و فنی بود حالا باید دوباره بخونمش ببینم چی گفته
استاد خیلی مخلصیم
روزتون خوش و خدا نگهدار
احمد آقا درود.
از آشنایی با شما خوشبختم، و تشکر از لقب “استاد” که لایق اون نیستم.
ممنون از توجه شما به این مطلب.
ارادت امیر خان. شاید بد نبود اشارهای هم به این میشد که این اپلیکیشن فعلاً فقط برای Iphone به دستهای آمریکا، کانادا، سنگاپور، نیوزیلند و هنگ کنگ قابل دانلود خواهد بود. البته بنده اطلاعی از راههای احتمالی دور زدنِ این محدودیت ندارم.
امید جان ارادت. آقا ببینیمت!
تغییر App Store تنها راه ساده دور زدن محدودیتی هست که به اون اشاره کردی؛ اما این راهکار مشکلات خودش رو هم داره. برای افرادی مثل ما که از App Store آمریکا استفاده میکنیم که البته مشکلی نیست.
سلام از اطلاعات خوبی که در اختیارمون گذاشتید بی نهایت ممنونم.
سلام. سپاس از لطف شما.
سلام, مطلب جالبی بود, فقط کاش ی فکری ام به حال ما فارسی زبانا میشد, سپاس از لطفتون
سلام و سپاس از توجه شما. به هر حال باید منتظر بود و کمی هم امید داشت.
درود و سپاس از اطلاع رسانی مفیدتان فقط میتوانم بگویم جل الخالق .
درود و سپاس از توجه شما.
سلام بسیار جالب بود. تشکر. یه سوال: نرم افزار اندرویدی وجود دارد که مانند این نرم افزار آن را بر روی نوشته های اشیا گرفت و سریع برامون بخونه؟!
سلام. سپاس از لطفتون.
تا جایی که میدونم موجود نیست. ولی من درباره اندروید به اندازه آیاواس اطلاع ندارم. حتماً سایر دوستان دقیقتر در جریان هستن.
در یک کلام آلیه! آلیه! آلیه!
روی آیفون۶s تست کردم! اونقد شگفت زده شدم از عسر تا به حال که هنوز رو شُک موندم!
با دوربین رابطه مستقیم داره! پس از ۵اس پایین تر فایده نمیده.
نگاه نکردم ببینم چه ios میخواد ولی زیر ۵اس اصلن تست هم نکنید چون نتیجه زیاد جالب نخواهد شد!
ساعالی بود در خدمتم!
درود. خوشحالم دستکم یک نفر از خوانندگان موفق به آزمایش این نرمافزار شد.
تنها محدودیتی که به طور رسمی اعلام شده، دسترسی به کانال محصول یا بارکد هست که برای گوشیهای پایینتر از ۶ در دسترس نیست. ولی به طور کلی پیشنهاد شده از آیفون ۶ به بالا استفاده بشه.
مرسی امیر حسین دمت گرم داداش
قربان شما.
سلام جناب سلیمانی. پست شما رو مطالعه کردم و فقط خواستم صمیمانه تشکر کنم. پیروز باشید.
سلام. ممنون از لطف و توجه شما. ایام به کام.
سلام بسیار عالی بود. خوندن همچین مطالبی هم باعث خوشحالیه و هم تاسف. خوشحالی بابت این که هر روز یه چیز جدیدی زندگی ما را بهتر میکنه و تاسف از این که ما ایرانیها و کلا فارسی زبانها همیشه چند پله از قافله عقب هستیم.
باز هم بابت مطلب خوبتون ممنون
سلام و سپاس از لطف شما.
کاملاً حق با شماست.
این که هنوز برای زبان فارسی به معنای واقعی “تی تی اس” و “او سی آر” طراحی نشده، و این که نبود این دو راهکار مهم به سایر پروژههای پژوهشی درباره زبان فارسی آسیب وارد میکنه جای تأسف هست.
البته گوگل برای او سی آر فارسی گامهای خوبی برداشته و کمپانی ABBYY — سازنده FineReader هم او سی آر فارسی داره؛ ولی دسترسی به اونها در قالبی سهلالوصول دشوار هست.
آقای سلیمانی میتونم خواهش کنم در مورد دو تا نرمافزاری که توی متن اسم بردید هم توضیحاتی بدید. منظورم اون دو تا نرمافزاریه که با کلمه “Be” شروع شدند.
بله حتماً.
نرمافزار Be My Eyes به کاربر امکان میده از طریق برقراری ارتباط ویدئویی با یکی از داوطلبان که از افراد بینا تشکیل میشن، به حل مشکلاتش بپردازه. میتونید در این برنامه یک تماس ایجاد کنید. بعد یکی از داوطلبها به تماس شما پاسخ میده و از طریق دوربین گوشی آیفون، محیط اطراف شما رو میبینه. برای مثال، شما میتونید از اون فرد درخواست کنید نوشته روی داروها، صفحه نمایش کامپیوتر، و… رو براتون بخونه، رنگ لباسهای شما رو اعلام کنه، در فروشگاه به شما کمک کنه اجناس مورد نظرتون رو انتخاب کنید، بهتون درباره موانع موجود در یک پیادهرو توضیح بده، و خلاصه درباره هر موضوعی که به نوعی به بینایی نیاز داره به شما کمک کنه. Be My Eyes در حال حاضر حدود ۵۱۲ هزار داوطلب در نقاط مختلف جهان داره. همچنین امکان مطرح کردن پرسش به یک زبان خاص در این برنامه در نظر گرفته شده. این هم سایتش: http://bemyeyes.com/
BeSpecular هم عملکردی شبیه به Be My Eyes داره؛ با این تفاوت که به جای برقراری ارتباط مستقیم ویدئویی با یک داوطلب، شما از شیئی که مد نظرتون هست عکس میگیرید و اون عکس رو برای داوطلبان ارسال میکنید. همچنین میتونید در کنار اون عکس، یک پیام صوتی یا متنی بفرستید. داوطلبها عکس و پرسش صوتی یا متنی مورد نظر شما رو دریافت میکنن، و شما هم به جای یک پاسخ، چندین پاسخ از چندین داوطلب دریافت میکنید. سایتش هم هست http://www.bespecular.com
امیدوارم پاسخ من مورد قبول شما واقع بشه.
باسلام.
اینکه یه نرم افزار بتونه همچین امکاناتی رو در اختیار آدم قرار بده واقعا رویایی و مسحور کنندست. خوب راستش من آرزو ندارم که نسخه اندروید این نرم افزار به بازار بیاد! چون معمولا نسخه اندروید در مقایسه با IOS جدا مثل اسباب بازی هستش. این رو کسانی که با آیفن کار کردن خوب میدونن. ای کاش اپل از زبان فارسی در voice over پشتیبانی کنه و شرکت های داخلی هم به جای سرمایه گذاری های بی هوده در اندروید، به سمت IOS هم نگاهی داشته باشند. البته این پشتیبانی بخش دولتی و نیز خواست ما ها رو هم نیاز داره. چند سال قبل بنده با کمک آقای اسدی کمپینی برای جلب حمایت Apple جهت پشتیبانی از زبان فارسی در TTS راه انداختیم اما متاسفانه Apple توجهی نکرد.
در اوصاف آیفن باید بگم اگر به آیفن بگیم گوشی، به سامسونگ و سایر اندرویدی ها اسباب بازی هم نمیشه گفت. جدا بدون اغراق گفتم.
سلام. ممنون از توجه شما.
با بخش زیادی از گفتههای شما موافقم گرچه گذاشتن نام اسباببازی بر روی گوشیهای اندرویدی، دستکم بر روی برخی از پرچمدارهای اندروید، کمی بیانصافی هست.
با سلام،
به عنوان یک نابینا، به وجود نابینایی مثل شما افتخار می کنم.
امتحان کردم و تا چند دقیقه هنگ هنگ بودم.
ممنون از اطلاع رسانی به موقع شما
با تشکر از شما دوست عزیز. خوشحالم این مطلب مورد پسند شما واقع شده.
سلام امیرخان.
بیشک از خبرنگار و مترجمی چون شما که سالهاست در حوزه تکنولوژی های روز مطالعه داره، تنظیم اینچنینی هم انتظار میره.
هر چند پنج روز پیش خبر این اپلیکیشن فوق العاده رو در وبسایت پکتوس برای مخاطبانمون ترجمه و منتشر کردیم، اما حقیقتاً از اطلاعات کاملی که توسط شما در این پست عرضه شد لذت بردم.
ارادت فراووون.
امیر جان ارادت فراوان، و به گفته دستکم یکی از اعضای همین وبسایت، این یک تعارف نیست!
پیگیری و پوشش اخبار مرتبط با افراد دارای معلولیت بینایی از طرف شما قابل تقدیر هست.
لطف داری امیر عزیز.
یک نکته هم یادم رفت بگم، البته که در هر شرایطی باید امیدوار باشیم، اما دست کم در این مورد خاص اینکه اپل بخواد از زبان فارسی در میان موتور های صوتیش پشتیبانی کنه، چندان امیدی ندارم.
به چندین دلیل.
یکی اینکه هنوز هیچ اراده ای از طرف اپل در این ارتباط مشاهده نشده.
نکته ی دوم اینکه هیچ کدوم یک از tts های فعلی فارسی، استاندارد های لازم رو ندارن تا توسط شرکت های معتبر پشتیبانی بشن.
بازار محدود فروش هم از دیگر نکاتیه که باعث شده امثال اپل، هیچ تمایلی برای سرمایه گذاری در این بخش نداشته باشن.
اگه میبینیم در اندروید هم وجود داره، به خاطر متنباز بودن این سیستم عامل و توسعه دهنده های فراوانیه که اندروید داره.
بنابر این، از اونجایی که هیچ یک از زمینه های لازم برای پشتیبانی اپل از tts فارسی هنوز فراهم نیست، شخصاً خوشبین نیستم حالا حالا ها این اتفاق بیفته.
تا تحلیل و ارزیابی شما در این ارتباط چی باشه.
امیر جان با نظرت موافقم.
البته این که آیاواس از موتور صوتی و صداهای فارسی پشتیبانی نمیکنه بیش از این که به اپل مربوط باشه، به کمپانی Nuance مربوط هست که هنوز برای زبان فارسی اقدامی انجام نداده. بیش از ۸۰ درصد از صداهای آیاواس به وسیله Nuance تولید میشن — همون صداهای Vocalizer, و اپل فقط صداهای Siri و Alex رو خودش تولید میکنه. اگر زمانی در Nuance برای تولید موتور صوتی یا صدای فارسی اراده ای ایجاد بشه، بعد میشه از اپل انتظار داشت از اون صدا در آیاواس استفاده کنه.
نکته بسیار تأسفبار این هست که بعد از این همه سال و صرف این همه هزینه، همون طور که خودت گفتی، هیچ یک از موتورهای صوتی فارسی از استانداردهای لازم برای گنجانده شدن در محصولات اپل و حتی گوگل برخوردار نیستن. عجیب نیست که در اندروید، تنها گزینه کاربردی برای زبان فارسی هنوز eSpeak هست — با تمام اشکالاتی که داره و صدای رباتیکی که تولید میکنه.
با سپاس.
ثلام استاد مطلب فوق مفید و امیدبخشی بود. متشکرم
محمد جان خوشحالم مورد پسند واقع شد.
راستی با لقب “استاد” که به من دادی تصور میکنم ۵۰ ۶۰ ساله هستم! ممنون از لطفت.
seeing شگفت زده شدم
درود جناب امیر حسین جان بسیار ممنون از تحقیق مو شکافانتون در خصوص این پدیده
حالا بغیر از جناب سرمدی که من به ایشون لقب tk رو داده بودم حالا باید امیر به توان دو tk رو اضاف کنم
روشی رو که با گرفتن دوربین گوشی بر روی جعبه دارو و یا هر نوشته دیگه که بلافاصله متن رو میخونه جالب بود من این نوع خواندن رو در برنامه قدم که سال ۱۳۹۱ از شبکه تیوی پرشیا پخش میشد و با یک آقای کم بینا آلمانی مصاحبه می کردن دیدم که یه دستگاه داشت که روی سیدی و یا چیزهای دیگه میگرفت و پس از خواندن وسیله مورد نظرش رو از میان وسیله ها پیدا می کرد بود
به نظر من امیرجان بهزیستی و دولت و حکومت که حاضر نیستن توجه ای به کمبود ها و نیاز های ما در بخش تکنولژی بکنند یا بودجه ای رو برای این کار جهت پیشرفت ما و هم گام شدن با تمام دنیا تحت اختیار شرکت های خارجی قرار بدن
پس تنها راه ما تلاش خودمان هست که همون مثال قطره قطره جمع گردد…
خانم آیت اولین نفر بود و دیگر دوستان هم که زبان خوبی دارند به دنبال ایشون باید از طریق ایمیل و هر راه ارتباط دیگری که وجود دارد باید پیگیر بشیم و خواسته خودمان رو بر آنها تحمیل کنیم شاید زمان بر باشه ولی امکان پذیر هست
چون خوده من به همراه چند نفر دیگه در بخش کیبورد یاماها بالاخره تونستیم درصد زیادی از کمبود های دستگاه رو برطرف کنیم با وجود موانعی که نماینده ایرانی یاماها سر راهمون می گذاشت بعد از ۴سال موفق شدیم و حالا در ادامه منتظر نتیجه کارهامون در کیبورد جدیدش بنام تایرس۶ هستیم
شنیدم پیانو کار می کنید اگر در خصوص خرید کاری از دستم بر بیاد در خدمتم
و بسیار خورسند از آشنایی با شما
ممنون از لطف شما شادمهر عزیز.
درباره حل مشکلات خودمون و زبان فارسی هم فکر میکنم اگر یک انجیاو یا نهادی قویتر در حوزه نابینایان داشته باشیم، حتماً صدای ما در جهان بهتر شنیده میشه. متأسفانه دغدغه مراکز ویژه نابینایان در کشور، البته اگر بشه اونها رو با تعاریف بینالمللی انجیاو بدونیم، مسائل دیگری هست. جالب اینجاست که افراد دارای معلولیت شنوایی و جسمی-حرکتی از این حیث شرایط بهتری نسبت به نابینایان دارن.
درباره پیانو هم حتماً مزاحمتون میشم. البته من در این حوزه تازهکار هستم و کمتر از ۱ سال هست که تلاش میکنم دستی بر آتش داشته باشم. اتفاقاً یک پیانوی دیجیتال یاماها دارم و از امکاناتش راضی هستم؛ ولی کار با منوهای دستگاه به دلیل گویا نبودنشون ساده نیست.