موتورجستجو هوش مصنوعی پرپلکسیتی

سرچ هوش مصنوعی پرپلکسیتی؛ چت‌بات محبوب انویدیا

یک‌شنبه ۱۳ آبان ۱۴۰۳ - ۱۳:۳۰مطالعه 19 دقیقه
این روزها اگر دنبال چت‌باتی هستید که بهترین جایگزین هوش مصنوعی سرچ گوگل باشد و مقاله‌های بلند را برایتان خلاصه کند، فقط یک انتخاب دارید: پرپلکسیتی.
تبلیغات

شاید در میان انبوه چت‌بات‌های هوش مصنوعی، نام «پرپلکسیتی» (Perplexity) کمتر به گوش‌تان خورده باشد؛ اما این چت‌بات محبوبِ جنسن هوانگ، مدیرعامل شرکت سه‌تریلیون دلاری انویدیا است و اتفاقا توانسته در مدتی کوتاه، هیاهوی زیادی به پا کند؛ هرچند برای مدتی این هیاهو و محبوبیت، رنگ‌وبوی دردسر بزرگی به‌خود گرفت.

استارتاپ Perplexity AI صاحب یکی از محبوب‌ترین و جنجالی‌ترین اپلیکیشن‌های مبتنی‌بر هوش مصنوعی مولد است که با ترکیب موتور جستجو و مدل‌ های زبانی بزرگ، پاسخ‌های دقیق و باجزییاتی ارائه‌ می‌دهد. بنیان‌گذار پرپلکسیتی از این دغدغه‌مند بود که کاربران اینترنت در جستجوی پاسخ‌های سرراست به پرسش‌هایشان، هر روز زیر خروارها لینک آبی مدفون می‌شوند؛ پس سراغ توسعه‌ی ابزاری رفت که به‌ توصیف خودش، چیزی شبیه «فرزند ویکی‌پدیا و چت‌جی‌پی‌تی» است.

پرپلکسیتی به‌لطف سرمایه‌گذاری‌های کلان ازسمت چهره‌ها و شرکت‌های سرشناسی چون جف بیزوس و انویدیا، به‌ محبوبیت بزرگی دست‌ پیدا کرده و بین ۲٫۵ تا ۳ میلیارد دلار ارزش‌گذاری شده است. بااین‌حال، دو ماه پیش گزارش‌های مجله‌ی فوربز و وایرد این استارتاپ را به ردکردن مرزهای حرفه‌ای و اخلاقی به‌خاطر استفاده‌ی بی‌اجازه از محتوای آن‌ها متهم کرد.

ماجرای پرپلکسیتی به‌خاطر دو موضوع «پروتکل استثناکردن ربات‌ها»‌ (Robots Exclusion Protocol) و «استفاده‌ی منصفانه» (Fair Use) در قانون حق تکثیر پیچیده است؛ مفهوم اول، استانداری است که به‌کمک آن، وب‌سایت‌ها به کرالرهای وب اجازه‌ی دسترسی به بخشی از محتوای خود را نمی‌دهند. مفهوم دوم نیز چارچوبی قانونی برای استفاده‌ی رایگان یا بدون‌اجازه از محتوای دارای کپی‌رایت را در شرایط خاص فراهم می‌کند.

درادامه، به توضیح چت‌بات پرپلکسیتی و نحوه‌ی استفاده از آن می‌پردازیم و ماجرای این جنجال را از زوایای مختلف بررسی می‌کنیم.

کپی لینک

چت‌بات پرپلکسیتی؛ «موتور پاسخ‌دهنده»

اگر از Perplexity بخواهید خودش را معرفی کند، اینطور پاسخ می‌دهد:

Perplexity AI موتور جستجوی مبتنی‌بر هوش مصنوعی است که ویژگی‌هایی از موتورهای جستجوی سنتی را با چت‌بات‌ها ترکیب می‌کند. این سرویس با استخراج اطلاعات از مقالات تازه‌منتشرشده و ایندکس‌کردن روزانه‌ی وب، به پرسش‌های کاربران پاسخ‌های مختصر و درلحظه ارائه می‌دهد.

آراویند سرینیواس (Aravind Srinivas)، مدیرعامل پرپلکسیتی، محصول خود را «موتور پاسخ‌دهنده» و «فرزند ویکی‌پدیا و چت‌جی‌پی‌تی» می‌نامد. اینکه از پرپلکسیتی گاهی به‌عنوان «موتور پاسخ‌دهنده» به‌جای موتورجستجو یاد می‌شود، به این خاطر است که از هوش مصنوعی برای خلاصه‌کردن نتایج جستجو استفاده می‌کند.

وقتی پرسش خود را در باکس میان‌صفحه تایپ می‌کنید، پرپلکسیتی پاسخ نسبتا بلند و همراه‌با جزییاتی تولید می‌کند و در ادامه با پرسش‌های مرتبط از شما می‌خواهد درخواست خود را با جزییات بیشتری بهبود دهید. این موتور به‌جای لینک‌دهی مستقیم به سبک گوگل، پاسخ‌های مبتنی‌بر متن یا تصویر ارائه می‌دهد تا دیگر نیازی به کلیک‌های اضافی برای جستجوی اطلاعات نباشد.

رابط کاربری هوش مصنوعی پرپلکسیتی
«جایی که دانش آغاز می‌شود»؛ شعار پرپلکسیتی در صفحه جستجوی آن

مثلا اگر از پرپلکسیتی بپرسید بهترین رستوران اطراف را توصیه کند، ممکن است ابتدا پاسخ دهد که آیا به دنبال یک نوع غذای خاص هستید. پس از انتخاب پاسخ، سوال بعدی چت‌بات درباره‌ی بازه‌ی قیمتی خواهد بود. پرپلکسیتی منابع خود را در مربع‌های کوچکی در بالای نتایج نشان می‌دهد و کنار هر پاراگراف هم به‌سبک ویکی‌پدیا، منابع را داخل عددهایی کلیک‌پذیر می‌گذارد.

نام پرپلکسیتی در فارسی به‌معنی «سردرگمی» است که شاید عجیب و متناقض به‌نظر برسد؛ اما خود شرکت می‌گوید این نام، هدف آن‌ها را در ارائه‌ی پاسخ‌های دقیق و مفید حتی به پیچیده‌ترین و چالش‌برانگیزترین سوالات کاربران نشان دهد. ماموریت شرکت پرپلکسیتی «دسترسی آزاد و همگانی به دانش» عنوان شده است و می‌کوشد یادگیری و کشف موضوعات جدید را برای همه آسان‌تر کند.

پرپلکسیتی به‌معنی «سردرگمی» است تا توانایی این پلتفرم به پاسخ به چالشی‌ترین سوالات را نشان دهد

تجربه‌ی کاربری پرپلکسیتی به‌اندازه‌ای تمیز و پیشرفته است که بسیاری از کسب‌وکارهایی را که درآمدشان وابسته به ترافیک جستجو است، نگران و سرمایه‌گذارانی را که عطش بازدهی سود دارند، هیجان‌زده کرده است. پرپلکسیتی یک نسخه‌ی رایگان و یک نسخه‌ی «پرو» با هزینه‌ی ماهانه ۲۰ دلار ارائه می‌دهد که ظاهراً پاسخ‌های هوشمندتر و پرجزییات‌تری تولید می‌کند.

نمونه جستجو در موتورجستجوی پرپلکسیتی
پرپلکسیتی به‌سرعت پاسخ سوال را از چندین منبع گردآوری می‌کند
سوال follow up در موتورجستجوی پرپلکسیتی
با Follow Up می‌توانید درباره بخش خاصی از پاسخ، دوباره سوال کنید

سرمایه‌گذاران اولیه‌ی پرپلکسیتی شامل چهره‌های برجسته‌ای از دنیای تکنولوژی هستند، از جمله جف بیزوس، مدیرعامل آمازون، سوزان وجیتسکی مدیرعامل سابق یوتیوب، جف دین دانشمند ارشد گوگل، نت فریدمن مدیرعامل سابق گیت‌هاب، یان لکون دانشمند ارشد هوش مصنوعی متا، آندری کارپاتی مدیر سابق هوش مصنوعی تسلا و همچنین شرکت نرم‌افزاری Databricks و صدالبته غول دنیای تراشه‌سازی، انویدیا که اخیرا به‌خاطر انقلاب هوش مصنوعی، سه تریلیون دلاری شد. وقتی وایرد از جنسن هوانگ، مدیرعامل انویدیا، درباره‌ی استفاده از چت‌بات‌های هوش مصنوعی پرسید، او با اشتیاق پاسخ داد که از پرپلکسیتی استفاده می‌کند.

پرپلکسیتی چت‌بات محبوب مدیرعامل انویدیا است

پرپلکسیتی برخلاف شرکت‌های مطرح هوش مصنوعی ازجمله OpenAI و گوگل، مدل زبانی خودش را ندارد و درعوض از ترکیبی از مدل‌های متن‌باز یا تجاری موجود ازجمله GPT 3.5-turbo و GPT 4-turbo محصول شرکت OpenAI و همچنین نسخه‌های سفارشی مدل هوش مصنوعی Llama از شرکت Meta، یک مدل از استارتاپ فرانسوی Mistral AI و مدل Claude از شرکت آنتروپیک برای تبدیل اطلاعات جمع‌آوری‌شده از اینترنت به پاسخ‌های هدفمند استفاده می‌کند.

ازآن‌جایی‌که تمام این مدل‌ها برپایه‌ی معماری شبکه‌ی عصبی ترنسفورمر گوگل توسعه داده شده‌اند، می‌توان پرپلکسیتی را یکی از چندین شرکت دیگری دانست که سعی دارد با استفاده از فناوری گوگل با گوگل رقابت کند. درنتیجه، برتری پرپلکسیتی به‌خاطر رابط کاربری منحصربه‌فرد و تجربه‌ی رضایت‌بخش جستجو است، نه مدل زبانی هوش مصنوعی آن.

در مقایسه با امپراتوری گوگل، رد پای پرپلکسیتی بسیار کوچک است؛ تنها ۱۰ میلیون کاربر فعال روزانه دربرابر چیزی حدود ۲٫۵ میلیارد کاربر گوگل سرچ. بااین‌حال، سرینیواس و سرمایه‌گذارانش معتقدند که پرپلکسیتی می‌تواند بازار گوگل سرچ را به هم بریزد. سرینیواس می‌گوید:

ما در لحظه‌ای منحصربه‌فرد از تاریخ قرار داریم. بهترین فناوری همیشه در داخل گوگل وجود داشت و گوگل کسب‌وکاری تمام‌عیار حول ۱۰ لینک آبی ساخت. اما اکنون آنتروپیک، OpenAI و Llama را داریم. ابزارهای هوش مصنوعی برای ساخت موتور پاسخ‌دهنده‌ی پرپلکسیتی اکنون خارج از گوگل وجود دارند.

پرپلکسیتی هنوز در اوایل راه قرار دارد، اما توانسته در همین مدت کوتاه به پیشرفت چشم‌گیری دست پیدا کند. موتور جستجوی پیشرفته‌ی این شرکت می‌تواند معنای پرسش‌ها را به‌خوبی درک کند و براساس منابع مختلف، پاسخ‌های مرتبط ارائه دهد. قابلیت‌های دیگری نظر تولید کد، ایجاد جدول و حل مسائل ریاضی هم در دست توسعه‌ هستند.

کپی لینک

آراویند سرینیواس؛ از دیپ‌مایند تا پا جای پای سوندار پیچای

آراویند سرینیواس مدیرعامل شرکت Perplexity AI، می‌خواهد با کسب‌وکارش، بازار گوگل سرچ را مختل کند؛ جالب اینکه شرکت سرینیواس نه‌تنها از مدل‌های مبتنی‌بر تکنولوژی گوگل برای این کار استفاده می‌کند، بلکه سرینیواس و سوندار پیچای هر دو در شهر چنای در جنوب هند بزرگ‌ شده‌اند؛ البته با ۲۲ سال اختلاف سنی. زمانی‌که سرینیواس درحال تحصیل درمقطع دکترای علوم کامپیوتر در دانشگاه برکلی کالیفرنیا بود، پیچای به‌سمت مدیرعاملی گوگل منصوب شده بود.

سرینیواس اولین دوره‌ی کارآموزی تحقیقاتی خود را در دیپ‌مایند گوگل در لندن گذراند. همان‌ سال، پیچای مدیرعامل آلفابت و گوگل شد. برای سرینیواس، کار در دیپ‌مایند هیجان‌انگیز بود، اما آپارتمانی که ندیده، اجاره کرده بود، فاجعه بود؛ «خانه‌ای افتضاح و پر از موش»، برای همین گاهی‌اوقات در دفتر دیپ‌مایند می‌خوابید.

آراویند سرینیواس / Aravind Srinivas
آراویند سرینیواس مدیرعامل Perplexity AI
Getty Images

سرینیواس در کتاب‌خانه‌ی دفتر دیپ‌مایند کتابی درباره‌ی توسعه و تکامل گوگل با‌عنوان «درون پلکس» (اشاره به گوگل‌پلکس، نام مستعار دفترمرکزی گوگل در مانتین‌ویو) پیدا کرد و به وایرد گفت این‌قدر این کتاب را خوانده که می‌تواند بخش‌هایی از آن را از بر بگوید. سرینیواس گفت این کتاب باعث شد گوگل و نوآوری‌هایش را بهتر درک کند و «لری پیج و سرگی برین کارآفرینان قهرمان من شدند.»

مدیرعامل شرکت Perplexity AI می‌خواهد با کسب‌وکارش بازار گوگل سرچ را مختل کند

کمی بعد در سال ۲۰۲۰، سرینیواس به‌عنوان کارآموز تحقیقاتی در زمینه‌ی یادگیری ماشین برای بینایی کامپیوتر به گوگل‌پلکس در مانتین‌ویو راه یافت. سرینیواس به‌تدریج راه خود را در دنیای پرپیچ‌وخم گوگل پیدا کرد و توانست از برخی از تحقیقات خود در زمینه‌ی هوش مصنوعی به‌خوبی استفاده کند.

در سال ۲۰۲۲، سرینیواس و سه پژوهشگر دیگر به‌نام‌های دنیس یاراتس، جانی هو و اندی کنوینسکی دور هم جمع شدند تا روش جدیدی برای جستجو در اینترنت بااستفاده از هوش مصنوعی توسعه دهند. آن‌ها ابتدا بر روی الگوریتم‌هایی کار کردند که می‌توانست زبان طبیعی را به زبان SQL دیتابیس ترجمه کند، اما این کار بیش‌ازحد محدود و تخصصی بود. درعوض، سراغ توسعه‌ی محصولی رفتند که ترکیبی از جستجوی سنتی و قدرت نسبتا نوظهور مدل‌‌های زبانی بزرگ بود. آن‌ها نام این محصول را «Perplexity» گذاشتند.

بنیان‌گذاران پرپلکسیتی
بنیان‌گذاران پرپلکسیتی؛ از چپ: جانی هو، آراویند سرینیواس، دینس یاراتس

الاد گیل، کارمند سابق گوگل که اولین دور سرمایه‌گذاری پرپلکسیتی را هدایت کرد، بلافاصله تحت‌تاثیر سرینیواس و ایده‌هایش قرار گرفت؛ نظری که بسیاری از سرمایه‌گذاران OpenAI درباره‌ی سم‌ آلتمن، مدیرعامل شرکت داشتند. گیل درمورد سرینیواس می‌گوید: «ما درباره‌ی یک مفهوم یا قابلیتی ایده‌هایمان را مطرح می‌کردیم و تنها ظرف چند ساعت یا چند روز، سرینیواس آن را به واقعیت تبدیل می‌کرد. او فوق‌العاده خوب است.»

کپی لینک

چطور از پرپلسکیتی استفاده کنیم

هوش مصنوعی پرپلکسیتی هم‌ به‌صورت وب‌سایت و هم به‌عنوان اپلیکیشن برای کاربران آیفون و اندروید دردسترس است. کاربران هم می‌توانند به‌طور رایگان از قابلیت‌های این پلتفرم استفاده کنند و هم با پرداخت ۲۰ دلار اشتراک ماهانه‌، به مدل‌های پیشرفته‌تر (ازجمله سونار، Claude 3.5 و GPT-4o)، قابلیت تولید تصویر به‌کمک هوش مصنوعی مولد، آپلود فایل (PDF، ورد یا اکسل) و API برای توسعه‌دهندگان دسترسی داشته باشند.

رابط کاربری پرپلکسیتی

برای استفاده‌ از طرح رایگان پرپلکسیتی نیازی به ایجاد اکانت نیست و کاربران ایرانی نیازی به تغییر IP ندارند. البته ایجاد اکانت رایگان، امکان شخصی‌سازی پروفایل و به‌اشتراک‌گذاری کلکسیون مقالات را فراهم می‌کند. همچنین با انتخاب گزینه‌ی Download از پایین سمت چپ پنجره می‌توانید این موتور جستجو را برای iOS یا اندروید یا به‌صورت افزونه‌ برای مرورگرهای مبتنی‌بر کرومیوم دانلود کنید.

برای استفاده از پرپلکسیتی کافی است مراحل ساده‌ی زیر را انجام دهید:

۱. وارد وب‌سایت www.perplexity.ai شوید.

۲. سوال خود را در نوار جستجو تایپ کرده و روی فلش آبی کلیک کنید (امکان سرچ فارسی هم وجود دارد).

۳. پاسخ تولید‌شده و منابع ذکر‌شده را بررسی کنید.

۴. با استفاده از نوار جستجوی «Follow Up» در پایین پاسخ تولید‌شده، سوالات مرتبط دیگری بپرسید.

موتور جستجوی پرپلکسیتی علاوه‌بر ارائه‌ی پاسخ‌های دقیق و جامع به سوالات کاربران، قابلیت جستجوی تصاویر ویدیو را نیز در اختیار کاربر می‌گذارد که درحال‌حاضر، به‌شدت محدود است و به‌هیچ‌عنوان به‌ پای گوگل نمی‌رسد. این موتور همچنین قابلیت‌هایی مانند تولید متن، حل مسائل ریاضی، جستجو در شبکه‌های اجتماعی (به‌نظر می‌رسد فعلا به ردیت محدود است) و جستجو در مقالات دانشگاهی ارائه می‌دهد که ازطریق گزینه‌ی Focus در سمت چپ نوار جستجو دردسترس است.

حل مسئله ریاضی با پرپلکسیتی
حل مسائل ریاضی
کرال شبکه‌های اجتماعی در پرپلکسیتی
جستجو در شبکه‌های اجتماعی
نوشتن ایمیل با پرپلکسیتی
نوشتن ایمیل

پرپلکسیتی عمدتا موتورجستجو است؛ اما قابلیت نوشتن متن و حل مسائل ریاضی را دارد

پرپلکسیتی در بخش Library تاریخچه‌ای از سرچ کاربر را در خود ذخیره می‌کند؛‌ اما اگر نمی‌خواهید ردی از جستجوهایتان به جا بماند، می‌توانید گزینه‌ی Incognito را از سایدبار سمت چپ انتخاب کنید. در بخش Discover هم می‌توانید به مقاله‌هایی که به‌ انتخاب خود پرپلکسیتی، از چندین منبع مختلف به‌کمک هوش مصنوعی گردآوری و خلاصه‌نویسی شده‌اند، سر بزنید.

اما جالب‌ترین (و البته دردسرآفرین‌ترین) بخش پرپلکسیتی، Pages است که در آن، هوش مصنوعی براساس موضوعات موردنظر کاربر و استفاده از منابع مختلف، شروع به تولید مقاله می‌کند. این مقاله قابلیت بازنویسی توسط خود پرپلکسیتی و ویرایش توسط کاربر دارد. کاربران حتی می‌توانند به این مقاله، تصاویر مرتبط و بخش‌های دیگر اضافه کنند و درنهایت، مقاله را در پلتفرم پرپلکسیتی منتشر کنند.

تولید مقاله درباره اپل با Page پلتفرم پرپلکسیتی
تولید مقاله درباره اپل با Page پلتفرم پرپلکسیتی
تولید مقاله درباره اپل با Page پلتفرم پرپلکسیتی

با Pages می‌توان درباره هر موضوعی مقاله تولید کرد؛ حتی می‌توان تصویر هم گذاشت

ظاهر این مقاله‌ها به‌گونه‌ای است که انگار توسط نویسنده‌های واقعی نوشته و تنظیم شده‌اند و به‌صورت پیش‌فرض، منابع به‌کاررفته، نشان داده نمی‌شوند؛ چیزی که اتفاقا منشا دردسرهای اخیر این استارتاپ و درگیری‌اش با مجلاتی چون وایرد و فوربز بود.

کپی لینک

دردسرهای پرپلکسیتی

پرپلکسیتی در وب‌سایت خود تاکید کرده است که «تمام پاسخ‌ها به منابع موثق خبری، مقالات دانشگاهی و بلاگ‌های معتبر ارجاع می‌دهند»، اما چند وقت پیش معلوم شد که این چت‌بات نه‌تنها به‌درستی به وب‌سایت‌ها ارجاع نمی‌دهد، بلکه بی‌اجازه‌، از مطالبی که پشت پی‌وال قرار گرفته‌اند و حتی گوگل هم اجازه‌ی کرال کردن آن‌ها را ندارد، برای تولید مقاله‌ استفاده می‌کند.

همه‌چیز از ۶ ژوئن (۱۷ خرداد) شروع شد؛ روزی که مجله‌ی فوربز گزارشی تحقیقی درباره‌ی آزمایش پهپادهای هوش‌ مصنوعی با کاربردهای ظاهرا نظامی در شرکت جدید اریک اشمیت منتشر کرد. روز بعد، پرپلکسیتی در صفحه‌ی مخصوصی به‌نام «Pages» که بخش خبری آن محسوب می‌شود، با هوش مصنوعی خلاصه‌ای از این مقاله‌ را با هوش مصنوعی بازنویسی و منتشر کرد. علاه‌براین، برای این مطلب خلاصه‌شده از تصویر اختصاصی فوربز استفاده کرد که فقط کمی تغییر کرده بود.

ذکر منابع Pages در پلتفرم پرپلکسیتی
منابع متن به‌طور پیش‌فرض نشان داده نمی‌شود

جان پاچکوفسکی، سردبیر اجرایی فوربز در پلتفرم ایکس، پرپلکسیتی را به باد انتقاد گرفت و گفت این موتور هوش مصنوعی «بیشتر گزارش‌های ما را می‌دزد. نام ما و چند منبع دیگری که این گزارش را از ما بازنشر کرده بودند، به‌عنوان منبع می‌آورد، اما طوری‌که به‌راحتی نادیده گرفته می‌شود؛ درضمن، در ذکر منبع، وب‌سایت‌هایی را که از گزارش ما استفاده کرده بودند، برجسته‌تر از خود مقاله‌ی اصلی نشان می‌دهد.»

حدودا دو هفته بعد،‌ ۱۹ ژوئن، مجله‌ی وایرد گزارش تحقیقی مفصلی درباره‌ی پرپلکسیتی منتشر کرد و نشان داد که چگونه هوش مصنوعی این شرکت «مقالات وایرد را بازنویسی می‌کند و گاهی آن‌ها را به‌طور نادرست و با کمترین اشاره به منبع، خلاصه می‌کند.»

پرپلکسیتی به‌ استخراج محتوای پولی وب‌سایت‌ها متهم شده است

وایرد همچنین گفت پرپلکسیتی احتمالا پروتکل مسدودسازی ربات‌های جست‌وجوگر را نادیده می‌گیرد و از طریق یک IP ناشناس که طبق بررسی‌های وایرد، به پرپلکسیستی تعلق دارد، فایل‌های robots.txt را دور می‌زند و محتوای محافظت‌شده پشت پی‌وال را بی‌اجازه استخراج می‌کند.

سرینیواس در پاسخ به این اتهامات به فست‌کمپانی گفت که «پرپلکسیتی پروتکل استثناکردن ربات‌ها را نادیده نمی‌گیرد و درباره‌اش دروغ هم نمی‌گوید. فکر می‌کنم درباره‌ی سازوکار پرپلکسیتی دچار سوتفاهم شده‌اند. ما فقط از کرالرهای وب خودمان استفاده نمی‌کنیم، بلکه به کرالرهای توسعه‌دهندگان دیگر هم متکی هستیم.»

سرینیواس گفت کرالر وب مرموزی که وایرد شناسایی کرده، متعلق به پرپلکسیتی نبود، بلکه به یک شرکت متفرقه‌ی دیگر تعلق داشت. سرینیواس از ذکر نام این شرکت به‌خاطر امضای توافق‌نامه‌ی عدم‌افشا خودداری کرد و وقتی از او سوال شد که آیا از آن‌ها خواسته تا استخراج محتوای وایرد را متوقف کنند، از پاسخ طفره رفت و فقط گفت «قضیه پیچیده است.»

کپی لینک

پیچیدگی ماجرا

گزارش ۱۹ ژوئن وایرد مدعی است که پرپلکسیتی با نادیده‌گرفتن پروتکل استثناکردن ربات‌ها، بخش‌هایی از وب‌ را که ناشران نمی‌خواهند ربات‌ها به آن‌ها دسترسی داشته باشند، کرال کرده و اطلاعات آن را استخراج می‌کند.

پروتکل استثنا کردن ربات‌ها که اولین بار در سال ۱۹۹۴ مطرح شد، به توسعه‌دهندگان اجازه می‌دهد دسترسی ربات‌های جستجوگر وب را به صفحات خاصی از وب‌سایت‌شان مسدود کنند.

درکل، فرایند وب اسکرپینگ یا گردآوری از وب که طی آن ابزارهای کرال به‌طور خودکار اطلاعات را از صفحات وب استخراج می‌کنند، پدیده‌ی رایجی است و تمام موتورهای جستجو ازجمله گوگل این کار را انجام می‌دهند تا صفحات وب در نتایج جستجو قرار بگیرند. پژوهشگران و شرکت‌های دیگر نیز از کرالرها برای جمع‌آوری داده از اینترنت به‌منظور تجزیه‌وتحلیل بازار، پژوهش‌های علمی و آموزش مدل‌های یادگیری ماشین استفاده می‌کنند.

برای رعایت پروتکل robots.txt اجبار قانونی وجود ندارد

وب اسکرپرهایی که پروتکل استثناکردن ربات‌ها را رعایت می‌کنند، ابتدا فایل «robots.txt» در کد منبع وب‌سایت را می‌خوانند تا بفهمند استخراج اطلاعات از کدام صفحه‌ها مجاز است؛ برای مثال، این روزها استخراج داده‌های وب‌سایت برای ساخت مدل‌های هوش مصنوعی ممنوع است. موتورهای جستجو و شرکت‌های هوش مصنوعی ازجمله خود پرپلکسیتی اعلام کرده‌اند که به این پروتکل احترام می‌گذارند، اما اجبار قانونی برای رعایت آن وجود ندارد.

دیمیتری شولنکو، رئیس کارگزاری پرپلکسیتی در واکنش به اتهامات فوربز و وایرد به تک‌کرانچ گفت خلاصه‌کردن محتوای منتشرشده در وب با فرایند کرال‌کردن متفاوت است. «کرال زمانی است که فقط در وب گشت می‌زنید، اطلاعات را برمی‌دارید و ایندکس می‌کنید.» او اضافه کرد که IP پرپلکسیتی ممکن است به‌عنوان بازدیدکننده در وب‌سایتی ظاهر شود که دسترسی به آن در فایل robots.txt ممنوع شده، اما این اتفاق تنها زمانی می‌افتد که کاربر URL وب‌سایت را به درخواست خود اضافه کند که این مورد «به معنی کرال‌کردن نیست.» او تاکید کرد که «ما فقط داریم به درخواست مستقیم و خاص کاربر به آن URL سر می‌زنیم.»

درواقع، پرپلکسیتی دارد می‌گوید اگر کاربری به‌طور دستی URL سایتی را به چت‌بات بدهد، چت‌بات دیگر نقش کرالر وب را ندارد، بلکه به‌عنوان ابزاری برای کمک به کاربر در دریافت و پردازش اطلاعات موردنیاز او عمل می‌کند. اما از نظر وایرد و بسیاری از وب‌سایت‌های خبری دیگر، این تفاوت اهمیتی ندارد، چراکه بازدید از یک URL و استخراج اطلاعات آن به‌طور هزاران بار در روز دقیقا شبیه همان وب‌اسکرپینگ است.

از سوی دیگر، وایرد و فوربز پرپلکسیتی را به محتواربایی متهم کرده‌اند؛ جالب اینکه به‌گفته‌ی وایرد، پرپلکسیتی دقیقا محتوای همان مقاله‌ای را به سرقت برده که در آن به محتواربایی متهم شده بود.

خبرنگاران وایرد می گویند چت‌بات پرپلکسیتی یک متن شش پاراگرافی با ۲۸۷ کلمه تولید کرد که به‌طور دقیق نتیجه‌گیری مقاله و شواهد آن را خلاصه می‌کرد. یک جمله هم دقیقا با جمله‌ی مقاله یکی بود. طبق دستورالعمل‌های موسسه‌ی Poynter، اگر نویسنده (یا هوش مصنوعی) هفت کلمه متوالی از منبع را بدون تغییر استفاده کند، احتمالا سرقت ادبی صورت گرفته است.

اینجا پای «استفاده منصفانه» به میان می‌آید. اگرچه شرکت پرپلکسیتی قبول دارد که در ذکر منابع کوتاهی کرده و قول داده که در آینده آن را بهبود دهد، بااین‌حال معتقد است که این شرکت حق استفاده از مقالات رسانه‌ها برای ارائه‌ی خلاصه را دارد. اگر همین حالا از چت‌جی‌پی‌تی بخواهید یکی از مقاله‌های ورج یا وایرد را برایتان خلاصه کند، صریحا به شما خواهد گفت اجازه‌ی این کار را ندارد. کوپایلت مایکروسافت هم که اتفاقا مبتنی‌بر همان مدل زبانی است، تنها در حد چهار‌، پنج جمله‌ی کوتاه درباره‌ی مقاله صحبت خواهد کرد؛ اما پرپلکسیتی خلاصه‌ای پرجزییات‌تر ارائه می‌دهد که در بیشتر موارد، نیاز کاربر به خواندن خود مقاله را از بین می‌برد.

پرپلکسیتی معتقد است خلاصه‌نویسی مقاله در حیطه استفاده منصفانه قرار می‌گیرد

قضیه‌ی «استفاده‌ی منصفانه» کمی پیچیده است، چراکه سرقت ادبی اگرچه کار ناپسندی به‌شمار می‌رود، غیرقانونی نیست. به‌گفته‌ی دفتر حق تکثیر ایالات متحده، استفاده از بخش محدودی از یک اثر، مثلا نقل‌قول‌ها برای مقاصدی مانند نقد، گزارش خبری و علمی، قانونی است. شرکت‌های هوش مصنوعی مانند پرپلکسیتی معتقدند که خلاصه‌نویسی مقاله هم در حیطه‌ی استفاده‌ی منصفانه قرار دارد.

شولنکو معتقد است که «هیچ‌کس نمی‌تواند حقایق را در مالکیت خودش نگه دارد. به‌محض اینکه حقایق دردسترس قرار بگیرند، همه می‌توانند از آن‌ها استفاده کنند.» از نظر شولنکو، متون خلاصه‌شده‌ی پرپلکسیتی شبیه وقتی است که خبرنگاران از اطلاعات منابع دیگر برای نوشتن گزارش‌های خود استفاده می‌کنند.

تحلیل وایرد مشکل دیگری در این محصول پرهیاهو را برملا کرد؛ اینکه برخلاف ادعای پرپلکسیتی که ابزارهای آن «پاسخ‌های فوری و قابل‌اعتماد به هر سوالی با ذکر کامل منابع» ارائه می‌دهند تا دیگر نیازی به «کلیک روی لینک‌های مختلف» نباشد،‌ این چت‌بات گاهی‌اوقات پاسخ‌های اشتباه می‌دهد و به اصطلاح دنیای هوش مصنوعی، دچار هذیان‌گویی می‌شود.

این‌طور که به‌نظر می‌رسد، در برخی موارد و باوجود نمایش گرافیکی در رابط کاربری که نشان می‌دهد چت‌بات قبل از ارسال پاسخ، درحال «خواندن» منابع است، پرپلکسیتی واقعا این منابع را نمی‌خواند و پاسخ خود را صرفا براساس URL و متادیتا ارائه می‌دهد. به‌عبارت دیگر و به قول ورج، ترفند جادویی پرپلکسیتی که این استارتاپ را به ارزشی ده‌رقمی رسانده این است که هم کاری را که می‌گوید نمی‌کند، انجام می‌دهد و هم کاری را که می‌گوید می‌کند، انجام نمی‌دهد.

سرینیواس دررابطه با این اتهام مدعی شد که وایرد از پرامپت‌هایی استفاده کرده که پرپلکسیتی را به‌طور هدف‌مند به‌سمت پاسخ‌های اشتباه هدایت کرده است و کاربران عادی با چنین نتایجی روبه‌رو نخواهند شد. «ما هرگز نگفته‌ایم که چت‌بات ما دچار توهم نمی‌شود.»

سرینیواس قبول دارد که در برخی موارد، پرپلکسیتی نتوانسته به‌طور کامل یا برجسته به منابعی که از آن‌ها محتوا را استخراج کرده، ارجاع بدهد، اما اتهام هرگونه فعالیت غیرحرفه‌ای یا غیرقانونی را رد کرده است.

سرینیواس همچنین گفت پروتکل استثنا کردن ربات‌ها «چارچوب قانونی» ندارد. از نظر او، ظهور هوش مصنوعی نیازمند تعریف نوع جدیدی از رابطه‌ی کاری بین تولید‌کنندگان محتوا با پلتفرم‌هایی مثل پرپلکسیتی است.

درهمین‌راستا، مصطفی سلیمان، مدیرعامل کسب‌وکار هوش مصنوعی مایکروسافت هم در صحبتی جنجالی گفت هر محتوایی که به‌صورت رایگان در اینترنت منتشر می‌شود، به‌عنوان رایگان‌افزار شناخته خواهد شد و هرکسی می‌تواند بدون مجوز از آن استفاده کند. درحالی‌که محتواهای تولیدشده، به‌طور خودکار دارای کپی‌رایت هستند و همه‌ی پلتفرم‌ها موظف‌‌اند که حق کپی‌رایت را رعایت کنند.

کپی لینک

راهکار هوشمندانه پرپلکسیتی برای راضی‌کردن رسانه‌ها

شرکت‌های هوش مصنوعی ازجمله OpenAI قراردادهایی را با تعدادی از رسانه‌های خبری امضا کرده‌اند تا به محتوای فعلی و آرشیوی آن‌ها برای آموزش الگوریتم‌های خود دسترسی پیدا کنند. در ازای این دسترسی، OpenAI به رسانه‌ها وعده می‌دهد که مقالات خبری آن‌ها را در پاسخ به پرسش‌های کاربران ChatGPT نمایش دهد.

پرپلکسیتی تا پیش از شروع دردسرهای کپی رایت، برنامه‌ای برای همکاری و جلب رضایت رسانه‌ها نداشت؛ اما اخیرا ابتکار جدیدی به‌نام «برنامه‌ی ناشران» را معرفی کرده تا در ازای استفاده از محتوای رسانه‌ها، هزینه‌ی مشخصی را به آن‌ها پرداخت کند. رسانه‌هایی که تاکنون این قرارداد را با پرپلکسیتی امضا کرده‌اند، عبارت‌اند از: فورچون، تایم، وردپرس، اشپیگل، آنترپرنور و تگزاس تریبیون. جالب است که نامی از وایرد و فوربز در این فهرست به چشم نمی‌خورد.

وردپرس از برنامه پرپلکسیتی برای تقسیم درآمد هیجان‌زده است

پرپلکسیتی قصد دارد بخش تبلیغات را به ویژگی «سوالات مرتبط» موتورجستجوی خود اضافه کند تا هر بار کاربری با این محتوا تعامل برقرار کرد، ناشران به‌طور مستقیم سهمی از درآمد تبلیغاتی این پلتفرم را دریافت کنند. علاوه‌براین، ناشران به APIها و پشتیبانی توسعه‌دهندگان پرپلکسیتی دسترسی رایگان خواهند داشت تا بتوانند موتورپاسخ سفارشی در وب‌سایت خود ایجاد کنند.

تمام کارمندان رسانه‌های شریک پرپلکسیتی همچنین به‌طور رایگان اشتراک یک‌ساله‌ی طرح «پرو سازمانی» این موتورجستجو را دریافت خواهند کرد که شامل ویژگی‌های پیشرفته‌ی حفظ حریم شخصی و امنیت داده‌ است.

مدیرعامل اتوماتیک، شرکت توسعه‌دهنده‌ی وب‌سایت وردپرس، به ورج گفت که «تقسیم درآمد پرپلکسیتی با ناشران بسیار بهتر از گوگل است که خب صفر است!» اتوماتیک می‌گوید مبالغ دریافتی از پرپلکسیتی را بین مشتریان وردپرس تقسیم خواهد کرد. «مبلغ دقیقش را نمی‌دانم، اما احتمالا در ابتدا کم خواهد بود، چون پرپلکسیتی درحال‌حاضر درآمد زیادی ندارد. اما اگر این موتورجستجو واقعا قرار است جای گوگل را بگیرد، که فکر می‌کنم شانسش را دارد، این درآمد چشم‌گیر خواهد شد. ما دنبال این هستیم که به هر شکل ممکن به کسب درآمد ناشران کمک کنیم.»

کپی لینک

آیا پرپلکسیتی می‌تواند جای سرچ گوگل را بگیرد؟

تکنولوژی هوش مصنوعی مولد قرار بود مدل جستجوی ما در اینترنت را متحول کند؛ یا دست‌کم این چیزی بود که از دو سال پیش با ظهور چت‌جی‌پی‌تی می‌شنیدیم و حالا هر غول فناوری درحال تبلیغ هوش مصنوعی خودش است؛ مایکروسافت با کوپایلت، گوگل با جمنای و اپل هم با اپل اینتلیجنس. اگرچه این تکنولوژی از پس انجام کارهایی بیشتر از جستجو در اینترنت برمی‌آید، پایین کشیدن سرچ گوگل از تخت سلطنت کماکان بزرگ‌ترین هدف هوش مصنوعی به نظر می‌رسد؛ حتی OpenAI، سازنده‌ی ChatGPT هم گفته که درحال ساخت موتور جستجویی برای رقابت مستقیم با گوگل است.

اما براساس اطلاعات شرکت تحقیقاتی سئو Ahrefs، چت‌بات‌های مبتنی‌بر مدل زبانی فقط در برخی موارد، مفیدتر از صفحه‌ی نتایج گوگل ظاهر می‌شوند؛ اما در بیشتر موارد، هوش مصنوعی برای جایگزین‌شدن با گوگل، مسیر بسیار دشواری را در پیش دارد.

به‌طور دقیق‌تر، هوش مصنوعی در نوع خاصی از سرچ که به آن جستجوهای اکتشافی می‌گویند، بهتر از گوگل عمل می‌کند؛ این مدل سوال‌ها (مثلا «چرا اره‌ برقی اختراع شد»)، پاسخ واحدی ندارند و درواقع شروع یک فرایند یادگیری هستند. درمورد جستجوی‌ اطلاعات مدفون هم هوش مصنوعی عملکرد بهتری دارد؛ زیرا می‌تواند جواب سوال (مثلا، چطور بایوس کامپیوتر را آپدیت کنیم) را از زیر انبوهی از تبلیغات و کلید‌واژه‌های سئویی بیرون بکشد و مستقیم به کاربر ارائه دهد.

اما کاربران فقط برای این مدل جستجو سراغ گوگل نمی‌روند و موتور جستجو هم برخلاف باور مدیرعامل پرپلکسیتی، صرفا صفحاتی از لینک‌های آبی نیست؛ بلکه بیشتر شبیه سیستم‌عامل بسیار کوچکی است که نیاز کاربر را به‌طور گسترده‌ای برطرف می‌کند. بیشتر اوقات، نیاز ما از سرچ گوگل صرفا جستجوی وب‌سایت است. اگر قصد کاربر از سرزدن به موتورجستجو، پیدا کردن آدرس زومیت باشد، گوگل و موتورهای سنتی بهتر از چت‌بات‌ها این کار را انجام خواهند داد.

گوگل درحال‌حاضر زیر ذره‌بین پرونده‌ی سنگین ضدانحصار دولت آمریکا قرار دارد که ممکن است به تجزیه‌شدن این شرکت ۲۶ ساله منجر شود. اما حتی در این شرایط هم به‌چالش‌کشیدن سلطه‌ی گوگل، بی‌نهایت دشوار و نیازمند نوآوری‌های اساسی است. در رقابت نفس‌گیر بین جستجوی سنتی و جستجوی هوش مصنوعی، یا گوگل باید مدل کسب‌وکارش را با این فناوری بهینه کند یا شرکت‌های هوش مصنوعی، چت‌بات بهتری از سرچ گوگل ارائه دهند. اینکه کدام‌یک زودتر به این راه‌حل می‌رسد قابل پیش‌بینی نیست.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات