اپل اینتلیجنس در آیفون ۱۶ پرو

بررسی هوش مصنوعی اپل؛ پیاده‌سازی زیباتر ایده‌های گوگل و سامسونگ

سه‌شنبه ۲۹ آبان ۱۴۰۳ - ۱۶:۵۳
مطالعه 32 دقیقه
اپل دیرتر از رقبا سوار قطار هوش مصنوعی شد، اما قابلیت‌های هوش مصنوعی گوشی‌های گوگل و سامسونگ را زیباتر از آن‌ها پیاده‌سازی کرده است.
تبلیغات

ده، یازده سال پیش، وقتی دانشمند ارشد توسعه‌ی Siri برای دومین بار پای تماشای فیلم Her نشست، سعی کرد بفهمد چه چیزی درباره‌ی سامانتا، شخصیت هوش مصنوعی فیلم، باعث شد قهرمان داستان بدون اینکه او را ببیند، عاشقش شود؛ جواب برایش واضح بود. صدای سامانتا به‌جای رباتیک بودن، کاملا طبیعی بود! و همین باعث شد سیری درiOS 11 که حدود چهار سال بعد عرضه شد، صدای انسانی‌(تری) داشته باشد. 

این مطلب با اضافه‌کردن بررسی ایمج پلی‌گراند، ایمج واند و جنموجی به‌روز شد.

موبایلکس حامی زومیت در تولید این ویدیو بوده است.

اما سامانتا فقط یک صدای طبیعی نبود، بلکه به‌حدی باهوش بود که فکر می‌کردی واقعا قدرت تفکر دارد و سیری iOS 11 هم قرار بود چیزی فراتر از یک صدای طبیعی باشد؛ یا دست‌کم این چیزی بود که اپل دوست داشت به ما نشان دهد. اپل در دمویی که آن سال از برنامه‌هایش برای سیری منتشر کرد، یک روز عادی از زندگی دواین جانسون را همراه با یار صمیمی‌اش سیری نشان داد. جانسون وقتی درحال ورزش و رسیدگی به گلدانش بود، از سیری می‌خواست تقویم و لیست یادآوری‌هایش را چک کند، برایش از Lyft تاکسی بگیرد، ایمیل‌هایش را بخواند، عکس‌های لباس‌هایی را که طراحی کرده، از گالری نشان دهد و درنهایت راک را در لباس فضانوردی و معلق در فضا می‌بینیم که از سیری می‌خواهد تماس فیس‌تایم برقرار کند و از او سلفی بگیرد. 

اپل اینتلیجنس iOS 18
زومیت

تقریبا در تمام تبلیغات کم‌وبیش اغراق‌آمیز سیری، اپل سعی داشت دستیار صوتی‌اش را به‌عنوان همراه همیشگی و مفیدی معرفی کند که می‌تواند از پس هر کاری برآید؛‌ بی‌آنکه لازم باشد بخواهیم برنامه‌ای را خودمان اجرا کنیم. اصلا سیری برای اپل به‌قدری مهم بود که فیل شیلر در مراسم رونمایی آیفون 4S آن را «بهترین ویژگی آیفون» معرفی کرد و گفت به‌زودی می‌توانیم از سیری بخواهیم کارهایمان را برایمان انجام دهد. 

اما این «به‌زودی» ۱۳سال طول کشید و هنوز هم برای دیدن «سیری واقعی» که در دموها نمایش داده می‌شد، باید دست‌کم تا سال دیگر منتظر باشیم؛ منظورم زمانی است که سیری با زیرنظر گرفتن تعامل کاربر با آیفون، سعی می‌کند او را بهتر بشناسد و ما را از بازکردن بسیاری از اپلیکیشن‌های روزمره بی‌نیاز کند.

فعلا آنچه نسخه‌ی بتای iOS 18.2 از سیری «هوشمندتر» در اختیار ما گذاشته، ادغام با ChatGPT و ابزاری به‌نام Visual Intelligence است که چیزی شبیه گوگل‌لنز و آنالیز تصویر چت‌جی‌پی‌تی را درکنار هم ارائه می‌دهد. برای استفاده از مولدهای تصویر اپل مانند «ایمج پلی‌گراند»، «جنموجی» و «ایمج واند» باید به لیست انتظار بپیوندید که تایید آن طی دو،سه هفته بعد انجام خواهد شد.

بااین‌حساب، اپل اینتلیجنس نه‌تنها دیرتر از رقبا به هیاهوی هوش مصنوعی پیوست و درحال‌حاضر تقریبا هیچ قابلیت جدید و منحصربه‌فردی برای ارائه ندارد، بلکه شاید ناقص‌ترین محصولی باشد که کوپرتینونشین‌ها به کاربرانشان عرضه کرده‌اند.

بااین‌حال، دیررسیدن بهتر از هرگز نرسیدن است و آینده‌ی اپل اینتلیجنس هیجان‌انگیزتر از وضعیت کنونی‌اش به‌نظر می‌رسد.

کپی لینک

سیری با چاشنی ChatGPT

ادغام سیری با ChatGPT به این معنی است که سیری به‌جای دست‌به‌دامن گوگل شدن برای پاسخ به درخواست‌های پیچیده، حالا دست‌به‌دامن چت‌بات محبوب OpenAI می‌شود (البته قبلش حتما اجازه می‌گیرد؛ هرچند می‌توان برای پاسخ سریع‌تر، این گزینه را با برداشتن تیک «Confirm ChatGPT Requests» در بخش ChatGPT تنظیمات، غیرفعال کرد).

کیفیت پاسخ‌ها همانی است که از چت‌جی‌پی‌تی انتظار داریم و اپل حتی گزینه‌ی دانلود اپلیکیشن این چت‌بات را در بخش Apple Intelligence & Siri تنظیمات دراختیارتان می‌گذارد؛ اما خبر خوب اینکه استفاده از چت‌جی‌پی‌تی رایگان است و نیازی هم به ساخت اکانت ندارد. اگر حساب پرو دارید، می‌توانید در اپلیکیشن لاگین کنید، اما اگر وارد حسابتان نشوید، OpenAI نمی‌تواند درخواست‌هایتان را ذخیره و بعد از آن‌ها برای آموزش چت‌باتش استفاده کند.

نسخه بتا اپل اینتلیجنس
نسخه بتا اپل اینتلیجنس
اجازه دسترسی به چت‌جی‌پی‌تی سیری
درخواست اجازه به ChatGPT
مشکل در پردازش درخواست چت‌جی‌پی‌تی سیری
برای استفاده از ChatGPT احتمالا باید IP را تغییر دهید

هوش واقعی سیری آنجاست که خودش تشخیص می‌دهد چه درخواستی را خودش جواب بدهد، چه درخواستی را از گوگل بپرسد و چه درخواستی را به ChatGPT بدهد. مثلا سوال درباره‌ی آب‌وهوا را خود سیری پاسخ می‌دهد، سوال درباره‌ی اخبار روز معمولا به گوگل سپرده می‌شود و اگر درخواستی برای تولید متن یا تصویر داشتید، سیری سراغ ChatGPT می‌رود؛ البته اگر حوصله کنید و سوال‌تان را با «Ask ChatGPT» شروع کنید، سیری مستقیما سراغ چت‌بات می‌رود.

پاسخ به سوال آب‌وهوا با سیری
پاسخ با سیری
پاسخ به سوال درباره اخبار با گوگل
پاسخ با گوگل
تولید متن با چت‌جی‌پی‌تی ادغام‌شده با سیری
پاسخ با ChatGPT

سیری جدید حس‌وحال خوبی دارد و تغییر رنگ‌ کیبورد و هاله‌ی رنگی اطراف نمایشگر هنگام تعامل با سیری چشم‌نواز است؛ از آن مهم‌تر اینکه دیگر لازم نیست برای سوال از سیری، اسمش را صدا بزنیم و با دابل‌تپ کردن بخش انتهایی صفحه، کیبورد بالا می‌آید و می‌توانید درخواست‌تان را برایش تایپ کنید (قابلیتی که افراد خجالتی مثل من از آن استقبال می‌کنند). اما استفاده از چت‌بات، آن‌ هم معروف‌ترینش، چیز جدیدی نیست و بعید است پیوند سیری با ChatGPT دست‌کم تا این لحظه، کسی را به‌وجد بیاورد.

برای هیجان‌انگیزشدن ماجرا باید تا سال ۲۰۲۵ منتظر بمانیم؛ زمانی‌که اپل قول داده بالاخره «سیری واقعی» ما را از سروکله‌زدن با اپلیکیشن‌های مختلف بی‌نیاز خواهد کرد.

کپی لینک

ویژوئال اینتلیجنس؛ فقط برای ‌آیفون ۱۶

اپل اینتلیجنس فقط برای کاربران آیفون ۱۵ پرو و جدیدتر و آیپدها و مک‌بوک‌های مجهز‌به تراشه‌های سری M دردسترس است؛ اما دسترسی‌به قابلیت Visual Intelligence در نسخه‌ی iOS 18.2 از این هم محدودتر است و فقط دراختیار کاربران سری آیفون ۱۶ قرار خواهد گرفت؛ آن‌هم به‌خاطر دکمه‌ی «کمرا کنترل».

ویژوئال اینتلیجنس اسم دهان‌پرکنی برای قابلیتی است که ابتکار اپل نیست و خیلی وقت پیش آن را با گوگل‌ لنز تجربه کردیم (البته قابلیت Circle to Search گوشی‌های سامسونگ هم وضعیت مشابهی دارد). با نگه‌داشتن دکمه‌ی کمرا کنترل، نمای دوربین باز می‌شود. اگر روی گزینه‌ی Search سمت راست ضربه بزنید، سوژه‌ای که در دوربین مشاهده می‌کنید، در بخش تصاویر گوگل جستجو می‌شود تا مشابه آن را در وبسایت‌های مختلف پیدا کنید. اگر هم گزینه‌ی Ask در سمت چپ صفحه را انتخاب کنید، چت‌جی‌پی‌تی وارد عمل می‌شود و تصویر را برایتان تجزیه‌وتحلیل می‌کند.

 قابلیت Visual Intelligence
ویژوئال اینتلیجنس فقط برای سری آیفون ۱۶
سرچ تصویر با گوگل در قابلیت Visual Intelligence
جستجوی تصویر در گوگل
آنالیز تصویر با ChatGPT در قابلیت Visual Intelligence
آنالیز تصویر با ChatGPT

رابط کاربری Visual Intelligence مینیمال و چشم‌نواز است و هم نتایج جستجوی سوژه در گوگل و هم پاسخ چت‌جی‌پی‌تی را درون کارتی روی تصویر ثبت‌شده نشان می‌دهد. درضمن، بعد از سپردن تصویر به ChatGPT می‌توانید بحث درباره‌ی سوژه‌ی تصویر را با چت‌بات ادغام‌شده در سیری ادامه دهید. نتایج هم در بیشتر موارد مفید و کاربردی هستند (مثلا وقتی دنبال نام گیاه خاصی می‌گردید)، اما یادتان باشد هوش مصنوعی همیشه قابل‌اطمینان نیست. مثلا من وقتی از دفترچه‌ یادداشتی با طرح هارد اکسترنال عکس گرفتم، ChatGPT به‌اشتباه فکر کرد که آنچه می‌بیند، واقعا هارد اکسترنال است و شروع به توضیح مشخصاتش کرد.

تصاویری که با ویژوئال اینتلیجنس می‌گیرید، در آیفون ثبت نمی‌شوند و اپل اطمینان می‌دهد که به این تصاویر دسترسی نخواهد داشت؛ اما اگر در اکانت ChatGPT لاگین کرده باشید، شرکت OpenAI به‌احتمال‌ زیاد برای تجزیه‌وتحلیل تصویر، نسخه‌ای از آن را در سرورهایش ذخیره می‌کند.

تنها سردرد ویژوئال اینتلیجنس مختص کاربران ایرانی است (البته به‌جز محدود بودن این قابلیت به آیفون‌های جدید)؛ درحالی‌که سرچ تصویر در گوگل نیازی به تغییر IP ندارد، برای آنالیز آن در ChatGPT به‌احتمال زیاد مجبور شوید آی‌پی‌تان را تغییر دهید. گاهی این تغییر باعث می‌شود سرچ گوگل کارش را به‌خوبی انجام ندهد و جابه‌جایی مدام بین VPN خاموش و روشن ممکن است آزاردهنده باشد.

کپی لینک

و بالاخره: پاک‌کن جادویی برای آیفون

اپل خیلی دیر سوار قطار هوش مصنوعی شد، اما جای خالی ابزاری برای حذف بی‌دردسر اشیای مزاحم از تصویر بیش از هر قابلیت هوش مصنوعی دیگری در آیفون احساس می‌شد. یادم می‌آید زمانی‌که گوگل برای اولین‌بار Magic Eraser را معرفی کرد، حسابی از عملکردش شگفت‌زده شده بودم. قابلیت Clean Up آیفون که حالا به اپلیکیشن Photos اضافه شده، دقیقا همان‌ عملکرد را دارد، اما دیگر از آن حس شگفتی خبری نیست؛‌ چون سه سال دیر عرضه شد.

گروهی از مردم درحال قدم‌زدن در محوطه باغ کتاب
تصویر اصلی
پاک‌کن Object Eraser سامسونگ - جمعیت
پاک‌کن آیفون
پاک‌کن Clean Up آیفون - جمعیت
پاک‌کن سامسونگ
دوربین و قوطی نوشیدنی انرژی زا کنار هم
تصویر اصلی
Clean Up آیفون - دوربین و قوطی
پاک‌کن آیفون
Object Easer سامسونگ - دوربین و قوطی
پاک‌کن سامسونگ

البته ابزار Clean Up آیفون در بیشتر موارد تمیز‌تر از Object Eraser گوشی گلکسی عمل می‌کند و اگر چیزی که می‌خواهید پاک کنید، کوچک باشد، به‌سختی می‌توان متوجه جای خالی‌اش در عکس شد. ابزار Clean Up به‌طور خودکار اشیای مزاحم را تشخیص می‌دهد و دورشان خط می‌کشد. تمام پردازش‌ها هم روی خود گوشی انجام می‌شود و به‌همین‌خاطر، بیشتر از چند ثانیه طول نمی‌کشد.

اما Clean Up ویژگی جدیدی برای عرضه ندارد و احتمالا اکثر کاربران آیفون که به چنین قابلیتی نیاز داشتند، مدت‌هاست از همان Magic Eraser گوگل فوتوز استفاده می‌کنند؛ به‌ویژه چون برای استفاده از مجیک ایریزر نیازی به آیفون‌های جدید و اپل اینتلیجنس ندارند.

کپی لینک

ابزار نوشتاری هوش مصنوعی

ابزار نوشتاری هوش مصنوعی آیفون (Writing Tools) که حالا به‌عنوان گزینه‌ی جدیدی بعد از Copy در محیط سافاری و همچنین کنار گزینه‌ی قلم در اپلیکیشن Notes دردسترس قرار گرفته، دقیقا همان چیزی است که تاکنون با محصولات گوگل، مایکروسافت و چت‌جی‌پی‌تی تجربه کرده‌ایم؛ البته با این محدودیت که از زبان فارسی پشتیبانی نمی‌کند و به‌همین‌خاطر، کاربرد گسترده‌ای برای کاربران ایرانی نخواهد داشت.

خود ابزار از گزینه‌های مختلفی ازجمله تصحیح متن، بازنویسی، لحن دوستانه، لحن حرفه‌ای، موجز، خلاصه‌نویسی، نکات کلیدی، فهرست‌سازی و ایجاد جدول تشکیل شده است که چهار گزینه‌ی آخر به‌اضافه‌ی نوار «Describe your change» که آزادی عمل بیشتری به کاربران می‌دهد (مثلا می‌توانید فرمت متن را به شعر تبدیل کنید)، همچنان در نسخه‌ی بتای iOS 18.2 غایب‌اند؛ اما احتمالا با انتشار نسخه‌ی عمومی در ماه دسامبر (آذر و دی ۱۴۰۳)، دردسترس قرار خواهند گرفت.

ابزار نوشتاری هوش مصنوعی آیفون
گزینه جدید Writing Tools
ابزار نوشتاری هوش مصنوعی آیفون
گزینه‌های مختلف Writing Tools
ابزار نوشتاری هوش مصنوعی آیفون
قابلیت بازنویسی متن Rewrite
ابزار نوشتاری هوش مصنوعی آیفون
بسیاری از بازنویسی‌ها پر از کلمات هیجانی هستند
ابزار نوشتاری هوش مصنوعی آیفون
لحن دوستانه
ابزار نوشتاری هوش مصنوعی آیفون
لحن حرفه‌ای
ابزار نوشتاری هوش مصنوعی آیفون
خلاصه‌نویسی
ابزار نوشتاری هوش مصنوعی آیفون
۴ گزینه‌ی آخر هنوز عرضه نشده‌اند

اگر بازنویسی متون انگلیسی به‌کارتان می‌آید، Writing Tools عملکرد نسبتا رضایت‌بخشی دارد؛ هرچند مدل زبانی اپل عادت دارد از کلمات هیجانی و توصیفات پرزرق‌وبرقی مثل «چشم‌گیر»، «منحصربه‌فرد» یا «نوآوارانه» استفاده کند، حتی در خلاصه! و این موضوع، ردپای هوش مصنوعی در متن را به‌وضوح نشان می‌دهد.

اما مهم‌ترین قابلیت‌های Writing Tools همان‌هایی هستند که هنوز در نسخه‌ی بتای iOS 18.2 دردسترس نیست و حدس می‌زنم تجربه‌ی یادداشت‌برداری در اپلیکیشن Notes را کاملا متحول کنند.

کپی لینک

مولد تصویر اپل

احتمالا شما هم مثل من برای اولین‌بار «جادو»ی تولید تصویر با هوش مصنوعی را با DALL-E تجربه کردید و بعد با نتایج نزدیک‌به‌ واقعیت Midjourney حسابی شگفت‌زده شدید؛ این ماجرا برای دو سال پیش است و کمتر کسی حالا از تماشای تبدیل چند کلمه به یک اثر هنری به هیجان می‌آید. بااین‌حال، اپل باز هم راهی پیدا کرده تا مولد تصویر هوش مصنوعی‌اش پس از دو سال تاخیر، حرف تازه‌ای برای گفتن داشته باشد.

مولدهای تصویر آیفون در سه دسته جا می‌گیرند: ایمج پلی‌گراند که شبیه قابلیت پیکسل استودیو گوگل، پرامپت‌های متنی را به تصاویر کارتونی تبدیل می‌کند؛ ایمج واند در اپلیکیشن Notes که شبیه قابلیت Sketch to Image سامسونگ، طرح‌های ناشیانه‌ی کاربر را به نقاشی‌‌های جذاب‌تری تبدیل می‌کند؛ و قابلیت منحصر‌به‌فرد جنموجی که از پرامپت‌های متنی کاربر، ایموجی‌های سفارشی می‌سازد.

برای استفاده از هر یک از این سه قابلیت اپل اینتلیجنس باید شرایط زیر مهیا باشد:

  • آیفون ۱۵ پرو به بعد
  • نصب نسخه‌ی دولوپر بتا 18.2 iOS
  • اکانت اپل آمریکا و انتخاب زبان انگلیسی برای Siri و کشور آمریکا برای گوشی
  • ارسال درخواست دسترسی به این قابلیت‌ها در بخش اپل اینتلیجنس تنظیمات

پس از پیوستن به لیست انتظار، باید کمی صبر کنید تا دسترسی‌تان به مولدهای تصویر آیفون تایید شود. تایید درخواست ما تقریبا دو هفته طول کشید. خوشبختانه برای استفاده از قابلیت‌های مولد تصویر نیازی به ابزار تغییر IP ندارید.

کپی لینک

ایمج پلی‌گراند

ایمج پلی‌گراند ابزار جدید و منحصر‌به‌فردی نیست؛ اما بعد از ساعت‌ها کار کردن با آن می‌توانم به‌جرئت بگویم که بهترین پیاده‌سازی را بین گوشی‌های مجهز‌به هوش مصنوعی دارد؛ چون هم کار با آن به‌شدت ساده است، هم تصاویر معمولا خوب از آب درمی‌آیند و هم اینکه می‌توانید بارها و بارها به تصاویر تولید‌شده برگردید، آن‌ها را با پرامپت‌های جدید اصلاح کنید و هرچقدر که می‌خواهید از یک پرامپت، تصویر تولید کنید.

تصویر تولید‌شده با ایمج پلی‌گراند آیفون
تصویر تولید‌شده با ایمج پلی‌گراند آیفون
تصویر تولید‌شده با ایمج پلی‌گراند آیفون
تصویر تولید‌شده با ایمج پلی‌گراند آیفون

ایمج پلی‌گراند را می‌توانید به‌صورت اپلیکیشن مجزایی با آیکون جانور بامزه‌ای در آیفون ببینید یا از بخش «+» آی‌مسیج به آن دسترسی داشته باشید. استفاده از این ابزار هم بی‌نهایت ساده و سرراست است؛ به‌طوری‌که می‌توانید با خیال راحت تمام توضیحات اپل را اسکیپ و بلافاصله شروع به خلق شاهکارهای هنری کنید. فقط کافی است پرامپت خود را در باکس پایین صفحه بنویسید و بعد برای ایده‌گرفتن و بهبود نتایج، یکی از گزینه‌های بخش‌های مختلف «تم»،‌ «مکان»، «اکسسوری» یا «لباس» را اضافه کنید.

ایمج پلی‌گراند اپل اینتلیجنس
ایمج پلی‌گراند اپل اینتلیجنس
ایمج پلی‌گراند اپل اینتلیجنس
ایمج پلی‌گراند اپل اینتلیجنس

از بخش «+» می‌توانید دو سبک مختلف «ایلاستریشن» برای تولید نقاشی‌های دوبعدی و «انیمیشن» برای نقاشی‌هایی با حا‌ل‌وهوای سه‌بعدی انتخاب کنید که نتایج انیمیشن معمولا بهتر از آب در می‌آیند. پلی‌گراند قرار بود سبک سومی به نام «اسکچ» برای طراحی‌ با قلم داشته باشد که به دلایلی نامعلوم از نسخه‌ی بتا حذف شد. این سبک همچنان در قابلیت «ایمج واند» دردسترس است.

اگر پرامپت حاوی کلمه‌ای مربوط به اشخاص باشد یا از پرامپت کمکی Custome استفاده کنید، آیفون از شما می‌خواهد یا از تصاویر گالری که حاوی چهره‌ی افراد واقعی هستند یا تصاویر کارتونی که به صورت رندوم تولید می‌شوند، انتخاب کنید. کارتونی‌کردن چهره افراد کیفیت بالایی دارد و از بین گزینه‌های پیشنهادی، بالاخره یکی، دو مورد نظرتان را جلب خواهد کرد. اما تصاویری که به‌صورت رندوم تولید می‌شوند، چنگی به دل نمی‌زنند و انعطاف‌پذیری زیادی ندارند.

طراحی دوبعدی و سه‌بعدی ایمج پلی‌گراند آیفون
سبک انیمیشن و ایلاستریشن
انتخاب چهره برای ایمج پلی‌گراند آیفون
انتخاب چهره افراد
انتخاب چهره برای ایمج پلی‌گراند آیفون
تصاویر تولید‌شده به چهره افراد نزدیک‌اند

ایمج پلی‌گراند معمولا تا ۵ پرامپت مختلف را به‌خوبی پردازش می‌کند، اما وقتی تعداد پرامپت‌ها از این حد بیشتر شود، تصاویر عجیب‌وغریب می‌شوند و فاصله‌شان با تصویر مدنظر دور می‌شود. نکته جالب اینکه اپل برای تعداد تصاویر تولید‌شده هیچ محدودیتی قائل نشده است و هر چه تصاویر را ورق بزنید، تصویر بعدی بلافاصه تولید می‌شود، اما با کیفیت پایین‌تر. پس اگر هیچ یک از چهار، پنج تصویر اول نظرتان را جلب نکرد، بعید است تصاویر بعدی باب میلتان باشد.

ساخت تصویر ربات با ایمج پلی‌گراند آیفون
ساخت تصویر ربات با ایمج پلی‌گراند آیفون
ساخت تصویر گیمر با ایمج پلی‌گراند آیفون
ساخت تصویر گیمر با ایمج پلی‌گراند آیفون

نکته‌ی جالب دیگر اینکه اپل اجازه می‌دهد به تصاویر تولید‌شده چه در ایمج پلی‌گراند و چه در ایمج واند برگردید و آن‌ها را با پرامپت‌های جدید، ویرایش کنید. درضمن می‌توانید به‌جای نوشتن پرامپت، یکی از تصاویر گالری را انتخاب کنید و با اضافه‌کردن پرامپت‌های خود اپلیکیشن، به آن حال‌وهوایی فانتزی ببخشید.

تبدیل عکس گالری به تصویر هوش مصنوعی با ایمج پلی‌گراند آیفون
تبدیل عکس گالری به تصویر هوش مصنوعی با ایمج پلی‌گراند آیفون
تبدیل عکس گالری به تصویر هوش مصنوعی با ایمج پلی‌گراند آیفون
افکت فانتزی معمولا تصاویر جذابی خلق می‌کند
تبدیل عکس گالری به تصویر هوش مصنوعی با ایمج پلی‌گراند آیفون
ایمج پلی‌گراند به‌خوبی المان کوه را به پشت پنجره اضافه می‌کند

از ایمج پلی‌گراند می‌توانید مستقیما در دل آی‌مسیج هم استفاده کنید و تصویر تولید‌شده را به دوستان‌ آیفون‌دارتان بفرستید. کافی است این ابزار را از لیست اپلیکیشن‌های آی‌مسیج انتخاب کنید تا با همان رابط کاربری و مراحل قبل رو‌به‌رو شوید.

استفاده از ایمج پلی‌گراند در آیمسیج
استفاده از ایمج پلی‌گراند در آیمسیج
استفاده از ایمج پلی‌گراند در آی‌مسیج
استفاده از ایمج پلی‌گراند در آیمسیج

ایمج پلی‌گراند در بیشتر موارد کارش را به‌خوبی انجام می‌دهد و از پس بسیاری از پرامپت‌های نسبتا پیچیده برمی‌آید (هرچند گاهی در تولید تصویر دست انسان با همان مشکل همیشگی شش‌ انگشت روبه‌رو می‌شود و هنوز توانایی به‌تصویر کشیدن زبان طبیعی را ندارد). البته کاربران اجازه‌ی استفاده از هر پرامپتی را ندارند؛ مثلا استفاده از کلمات حاوی خشونت و توهین‌آمیز یا نام محصولات و کاراکترهایی که کپی‌رایت دارند (حتی آیفون!) و اسامی اشخاص معروف و کشورها راه به جایی نمی‌برد، اما محصولات قدیمی مثل واکمن، مشکلی ایجاد نمی‌کند.

کپی لینک

ایمج واند

ایمج واند زیرشاخه‌ی ایمج پلی‌گراند است و ظاهرا از موتور مولد مشابهی برای تولید تصویر با هوش مصنوعی استفاده می‌کند؛ با این تفاوت که به جز دو سبک «Illustration» و «Animation»، سبک «Sketch» را هم برای نقاشی با قلم ارائه می‌دهد، درحال‌حاضر فقط در اپلیکیشن Notes دردسترس است و امکان تبدیل طرح‌های ناشیانه‌ای را که با انگشت روی آیفون یا با قلم رو آیپد کشیده‌اید، می‌دهد. از این نظر، ایمج واند شبیه قابلیت «Sketch to Image» سامسونگ عمل می‌کند، چون باید دور طرح را با ابزار مخصوصی (شبیه چوب جادو با سر رنگی) در بخش نقاشی Notes خط بکشیم تا به طراحی حرفه‌ای‌تری تبدیل شود؛ اما خبری از تصاویر واقع‌گرایانه‌ی هوش مصنوعی گلکسی نیست و همه‌چیز حالت کارتونی دارد.

تصویر گوشی هوشمند با ایمج واند - سبک اسکچ
سبک اسکچ
تصویر گوشی هوشمند با ایمج واند - سبک ایلاستریشن
سبک ایلاستریشن
تصویر گوشی هوشمند با ایمج واند - سبک انیمیشن
سبک انیمیشن

ایمج واند همچنین می‌تواند براساس متنی که در Notes نوشته‌اید، تصاویر (نسبتا) مرتبط ایجاد کند؛ گفتم «نسبتا» چون کلمات پرامپت را به‌صورت رندوم از متن انتخاب می‌کند که همیشه کلمات کلیدی نیستند و اگر در بین کلمات انتخاب‌شده، اسم شخص یا برند خاصی باشد، هوش مصنوعی اپل از تولید آن خودداری می‌کند. در این حالت باید پرامپت را خودتان دستی ویرایش کنید تا تصویر مدنظر تولید شود؛ اما شک دارم افراد زیادی بخواهند صرفا برای قشنگ‌تر شدن نوت‌هایشان برای نوشتن پرامپت وقت بگذارند.

ایمج واند برای پردازش شکل‌های ساده مانند گل خیلی خوب عمل می‌کند و اگر به طرح‌تان، پرامپتی مانند «قرمز» اضافه کنید، به رنگ قرمز درمی‌آید. من برای متنی که درباره‌ی گجت Rabbit R1 بود، پرامپت ساده‌‌ی «orange square device» را نوشتم و تصویر تولید‌شده شباهت زیادی به گجت واقعی داشت.

تولید تصویر با ایمج واند آیفون
تولید تصویر Rabbit R1 با ایمج واند آیفون
تولید تصویر Rabbit R1 با ایمج واند آیفون

اما وقتی پرامپت کمی پیچیده می‌شود و طرح ناشیانه‌ی ما هم جزییات زیادی نداشته باشد، تصاویر ایمج واند واقعا عجیب‌وغریب از آب در می‌آیند. مثلا طرحی که قرار بود توپ بسکتبال باشد با پرامپت رنگ‌های شیکاگو بولز، تبدیل به ظرفی از گوشت شد که اگرچه مثل توپ، گرد است و احتمالا از «Bulls»، مفهوم گاو نر برداشت شده، اما با چیزی که در ذهن داشتیم، فرسنگ‌ها فاصله دارد! ایمج واند طرح آدمکی را که قرار بود موهای بلوند و پیراهن نارنجی داشته باشد، به صندلی‌ای چرمی که رویش پارچه‌ای زرد انداخته شده، تبدیل کرد؛ شاید چون کلا اجازه ندارد تصاویر آدم‌ها را بسازد.

طرح ظرفی از گوشت با ایمج واند آیفون
طرح صندلی با ایمج واند آیفون

راستش را بخواهید، ایمج‌ واند در آیفون چندان کاربردی به‌نظر نمی‌رسد؛ هم به‌این‌خاطر که افراد کمی از اپلیکیشن Notes برای یادداشت‌برداری‌های طولانی که نیاز به تصویر داشته باشد، استفاده می‌کنند و هم به این‌خاطر که کشیدن طرح با انگشت حتی برای حرفه‌ای‌ترین هنرمندان هم چالش‌برانگیز است. ایمج‌ واند بیشتر از هر چیز برای آیپد بهینه شده است، به‌ویژه چون می‌تواند از روی متن دست‌‌نویس هم کلمات را برای پرامپت تشخیص دهد.

کپی لینک

جنموجی

اگر نظر من را بخواهید، جنموجی کاربردی‌ترین و سرگرم‌کننده‌ترین ابزار هوش مصنوعی است که تا به‌حال در گوشی هوشمند تجربه کرده‌ام؛ البته به‌ شرطی که اهل استفاده از ایموجی باشید و دایره‌ی دوستان آیفون‌دارتان هم وسیع باشد.

اپل با Genmoji که نامش از ترکیب کلمات «Generative AI» و «Emoji»‌ به‌دست آمده، به کاربر اجازه می‌دهد ایموجی دلخواهش را بسازد؛ از تبدیل‌کردن تصویر خود به ایموجی با حس‌وحال‌های مختلف تا انواع و اقسام خوراکی‌ها و مکان‌ها و ایده‌های عجیب‌وغریب. استفاده از جنموجی بی‌نهایت آسان است و به نیازی پاسخ می‌دهد که از مدت‌ها پیش وجود داشته است، نه مثل تولید تصاویر ساختگی که تا قبل از ظهور DALL-E و میدجرنی، اصلا به آن فکر هم نمی‌کردیم.

برای دسترسی به جنموجی کافی است سراغ آیکون ایموجی روی کیبورد بروید و بعد روی آیکون مخصوص جنموجی که در سمت راست این نوار قرار گرفته، ضربه بزنید یا در نوار بالای کیبورد که نوشته «Describe an Emoji»، شروع به توصیف ایموجی موردنظرتان کنید. مثلا دختری درحال اسکیت‌سواری یا خانه‌ای در حال سوختن یا آواکادوی خندان درحال سیگار کشیدن، دقیقا همان نتایجی را نشان داد که در ذهن داشتم. البته اینجا هم اپل اجازه می‌دهد برای هر پرامپت، تقریبا تا بی‌نهایت تصویر تولید کنید تا بالاخره به نتیجه‌ی مدنظر برسید؛ هرچند همان چند نتیجه‌ی اول معمولا بهترین هستند.

قابلیت جنموجی آیفون
قابلیت جنموجی آیفون
قابلیت جنموجی آیفون
قابلیت جنموجی آیفون

جنموجی‌ها را می‌توانید در پیام‌های آی‌مسیج برای دوستان‌تان بفرستید و افرادی که به اپل اینتلیجنس دسترسی ندارند، می‌توانند آن‌ها را ببینند و به لیست استیکرشان اضافه کنند؛ اما نمی‌توانید از این جنموجی‌ها در پست‌های شبکه‌های اجتماعی، ایمیل یا SMS استفاده کنید. درضمن، اینجا می‌توانید از چهره‌ی افراد مشهور مثل تیم کوک هم استفاده کنید، اما برای دستیابی‌ به بیشترین شباهت بهتر است از تصاویر گالری برای «Starting Point» استفاده کنید.

کپی لینک

قابلیت‌های جزیی: از سرچ هوشمند گالری تا حالت Focus جدید

اپل اینتلیجنس پر است از قابلیت‌های جزیی‌تری که شاید کمتر از پیوند سیری با ChatGPT و پاک‌کن Clean Up و ایمج پلی گراند به چشم بیایند، اما به‌احتمال‌زیاد در ساده‌تر کردن طیف متنوعی از کارها اهمیت داشته باشند.

جستجوی هوشمند در گالری

جستجوی تصاویر در گالری هوشمندانه‌تر شده و زبان طبیعی را می‌فهمد. برای کاربرانی که گالری‌شان هیچ نظم‌وترتیبی ندارد و جستجو بین هزاران عکس برایشان همیشه ماموریت غیرممکن تلقی می‌شده، هوش مصنوعی واقعا کارگشا است. نتایج همیشه با عبارت سرچ‌شده مرتبط نیستند، اما دست‌کم یکی، دو مورد به آنچه دنبالش هستید، نزدیک است. جالب اینکه سرچ جدید حالات صورت مثل اخم‌کردن و لبخند‌زدن را هم تشخیص می‌دهد و می‌تواند لحظات خاصی را در کلیپ‌های ویدیویی پیدا کند.

سرچ هوشمند مرد دوربین‌به‌دست در گالری آیفون
مرد دوربین‌ به‌دست
سرچ هوشمند دختر درحال اخم‌‌کردن در گالری آیفون
دختر درحال اخم
سرچ هوشمند محیط بیرون در شب در گالری آیفون
محیط بیرون در شب
سرچ هوشمند افراد درحال قدم‌زدن در گالری آیفون
افراد در حال راه رفتن

Focus Mode هوشمند

اپل حالت‌های Focus را برای کاهش حواس‌پرتی در iOS 15 معرفی کرد و حالا یک حالت جدید در مجموعه قابلیت‌های اپل اینتلیجنس اضافه شده است؛ حالت Reduce Interruptions که به‌کمک هوش مصنوعی، نوتیفیکیشن‌ها را براساس درجه‌ی اهمیت، اولویت‌بندی می‌کند و فقط آن‌هایی را نمایش می‌دهد که از نظر هوش مصنوعی، واقعا مهم هستند. امکان شخصی‌سازی این حالت مانند باقی Focus Modeها وجود دارد و می‌توانید اپ‌ها و صفحات موردنظرتان را فیلتر کنید.

حالت فوکوس Reduce Interruptions در آیفون
حالت فوکوس Reduce Interruptions در آیفون
حالت فوکوس Reduce Interruptions در آیفون
حالت فوکوس Reduce Interruptions در آیفون

اعلانات هوشمند

تا صحبت از نوتیفیکیشن‌ها است، این را هم اضافه کنم که هوش مصنوعی اپل حالا اعلانات را دسته‌بندی می‌کند و خلاصه‌ای در حد یک جمله از محتوای آن‌ها نمایش می‌دهد. خلاصه‌ی نوتیفیکیشن‌ها هم با اپ‌های خود آیفون مانند آیمسیج کار می‌کند و هم با اپ‌های جانبی. وقتی اپل اینتلیجنس را فعال کنید، نمایش اعلانات به‌طور خودکار هوشمند می‌شود، اما می‌توانید با غیرفعال‌کردن Summarize Previews از بخش Notifications در تنظیمات، نمایش اعلانات را به‌طور کامل یا صرفا برای یک اپلیکیشن خاص به‌ حالت عادی برگردانید.

خلاصه مقالات در سافاری

وقتی برای خواندن مقاله‌ای در سافاری وارد حالت Reader شوید (البته مقالات انگلیسی!)، در ابتدای مقاله گزینه‌ای به‌نام «Summarize» به‌چشم می‌خورد که با ضربه‌زدن روی آن می‌توانید در عرض چند ثانیه، خلاصه‌ای حدود ۵۰کلمه‌‌ای از کل محتوا را بخوانید.

قابلیت Summarize اپل اینتلیجنس
قابلیت Summarize اپل اینتلیجنس
قابلیت Summarize اپل اینتلیجنس
قابلیت Summarize اپل اینتلیجنس

در بیشتر موارد، خلاصه مقاله‌های غیراپلی لحن خنثی‌تری دارند

خلاصه‌ی مقالات در بیشتر موارد کارراه‌انداز است؛‌ مثلا وقتی مقاله‌ی بررسی بازی Dragon Age: The Veilguard را باز می‌کنید و صرفا می‌خواهید بدانید نظر فلان وب‌سایت درباره‌ی این بازی مثبت است یا منفی. تمایل هوش مصنوعی اپل به استفاده از کلمات هیجانی اینجا هم به چشم می‌خورد و مثلا درباره‌ی مقاله‌ی رونمایی مک‌مینی‌های M4، دیدن صفاتی چون «impressive» یا «stunning» در خلاصه، کمی زیاده‌روی به‌نظر می‌رسد. بااین‌حال، Summarize برای افرادی که سرشان شلوغ و زبان انگلیسی‌شان هم نسبتا خوب است، قابلیت مفیدی به نظر می‌رسد.

کپی لینک

هیجان‌انگیزترین قابلیت‌ها...هنوز در راه!

از عرضه‌ی آیفون ۱۶ بیش از یک ماه می‌گذرد و هنوز بسیاری از قابلیت‌های اپل اینتلیجنس به‌طور کامل و برای عموم دردسترس قرار نگرفته‌اند؛ ازجمله مولد‌های تصویر ایمج پلی‌گراند که فعلا در نسخه‌ی بتای 18.2 iOS ارائه شده‌اند یا برخی قابلیت‌های Writing Tools که حتی در این نسخه هم دردسترس نیستند.

اما به‌نظرم آنچه واقعا می‌تواند تجربه‌ی اپل اینتلیجنس را منحصر‌به‌فرد و «جادویی» کند، سیری است؛ البته نه به شکل کنونی، بلکه چیزی که قرار است در iOS 18.3 و 18.4 عرضه شود. اپل دارد روی قابلیت‌هایی مانند «آگاهی از صفحه‌نمایش»، «آنالیز رفتار کاربر» و «اکشن‌های درون‌برنامه‌ای» کار می‌کند تا دستیار صوتی‌اش به رویایی که سال‌ها در ذهن داشته است، نزدیک‌تر شود.

مثلا به‌لطف قابلیت آگاهی از صفحه‌نمایش می‌توانید به سیری بگویید «این عکس را برای فلانی ارسال کن» و سیری دقیقا می‌داند دارید درباره‌ی کدام عکس صحبت می‌کنید. سیری همچنین فهم بهتری از محتوای ایمیل‌ها و پیام‌ها دارد و اگر به سیری بگویید پیام خاصی را برایتان پیدا کند یا بگوید چه زمانی، فلان عکس را گرفته‌اید، می‌تواند به شما جواب دهد. و مهم‌تر اینکه کنترل سیری بر اپلیکیشن‌ها به‌طرز چشم‌گیری بیشتر خواهد شد و می‌تواند کارهایی را انجام دهد که تاکنون از پسش برنمی‌آمد.

البته تا آماده‌شدن این قابلیت‌ها باید دست‌کم تا سال ۲۰۲۵ منتظر ماند و معلوم نیست عملکرد سیری دقیقا همانی باشد که اپل بارها و بارها وعده داده است. تا آن موقع، شاید مهم‌ترین چالش پیش‌روی دستیار صوتی اپل این باشد که کاربران یادشان باشد که اصلا چیزی به اسم سیری وجود دارد.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات