با دوین آشنا شوید؛ وقتی هوش مصنوعی مهندس نرمافزار میشود [تماشا کنید]
Cognition استارتاپی در حوزهی هوش مصنوعی است که صندوق بنیانگذاران پیتر تیل و رهبران صنعت فناوری ازجمله الاد گیل، مدیر سابق توییتر و تونی شو، بنیانگذار Doordash از آن حمایت میکنند. این استارتاپ بهتازگی مهندس نرمافزار هوش مصنوعی کاملاً مستقلی به نام دوین (Devin) را معرفی کرده است.
درحالحاضر، ابزارهایی مثل کوپایلت گیتهاب را داریم که بهعنوان دستیار برنامهنویسی طبقهبندی میشوند؛ اما دوین میتواند فرایند توسعهی نرمافزار را از نوشتن کد گرفته تا رفع اشکالات و اجرای نهایی، بهطور مستقل انجام دهد.
معرفی دوین نشاندهندهی تغییری بزرگ در فضای توسعهی نرمافزار با کمک هوش مصنوعی است و مهندسان میتوانند اجرای کامل پروژههای خود را به آن واگذار کنند. در مقام مقایسه، دستیارهای برنامهنویسی مبتنیبر هوش مصنوعی مثل کوپایلت فقط میتوانند کدها را به برنامهنویسان پیشنهاد دهند.
درحالحاضر، دوین بهصورت عمومی دردسترس نیست و Cognition این هوش مصنوعی را دراختیار تعداد محدودی از مشتریان منتخب خود، ازجمله اشلی ونس، روزنامهنگار بلومبرگ، قرار داده است.
Devin دقیقاً چه کاری میتواند انجام دهد؟
اسکات وو، بنیانگذار و مدیرعامل Cognition، با انتشار بیانیهای مطبوعاتی توضیح داد که دوین میتواند در محیط سندباکس (Sandbox) به ابزارهای رایج توسعهی نرمافزار و پوستهها و ویرایشگر کد و مرورگر دسترسی داشته باشد و کارهایی مثل برنامهریزی و اجرای وظایف پیچیدهی مهندسی نرمافزار را انجام دهد.
مثل سایر چتباتهای هوش مصنوعی، کاربران بهسادگی درخواست خود را با زبان طبیعی به دوین میدهند و این ابزار برنامهای دقیق و گامبهگام برای نوشتن برنامه ایجاد میکند. دوین سپس روند ساخت پروژه را با استفاده از ابزارهای توسعهی خود آغاز میکند؛ درست مثل روشی که برنامهنویسان انسانی از آن استفاده میکنند.
درادامه، دوین مشکلات را برطرف میکند و پس از آزمایش کدها، گزارش پیشرفت کار را بهطور لحظهای ارائه میدهد و کاربران میتوانند همهچیز را بهدقت زیرنظر بگیرند.
اگر ناظر انسانی هنگام استفاده از دوین به مسئلهی خاصی برخورد کند، برای رفع آن میتواند دستورهایی را بهصورت چت به هوش مصنوعی ارائه دهد. براساس اعلام Cognition، این ویژگی به تیمهای مهندسی اجازه میدهد برخی از پروژههایشان را به هوش مصنوعی محول کنند تا زمان و انرژی بیشتری برای انجام کارهای خلاقانهتر داشته باشند.
دوین الگوی جدیدی ارائه میدهد که شاید بتوان آن را نمایی اجمالی از روند توسعهی نرمافزار در آیندهی نزدیک در نظر گرفت؛ جایی که کدنویسی و ساخت برنامهها با هوش مصنوعی انجام میشود و سرپرستان فقط روی مراحل انجام کار نظارت میکنند.
دموهای دوین نشان میدهند این ابزار طیف گستردهای از وظایف را میتواند انجام دهد که ازجمله میتوان به استقرار و بهبود برنامهها و وبسایتها بهصورت سرتاسری، رفع اشکالات در پایگاههای کد و موارد پیچیدهتر مثل تنظیم مدل زبانی بزرگ با استفاده از کدهای گیتهاب اشاره کرد.
Cognition با ارائهی مثالی از دوین برای ایجاد تصاویر حاوی پیامهای پنهان استفاده کرده است و در مثالی دیگر، این هوش مصنوعی با نوشتن کد و رفع باگها، پروژهای را در Upwork برای اجرای مدل بینایی کامپیوتری (Computer Vision) مدیریت کرد.
مهندس نرمافزار هوش مصنوعی Cognition در آزمایش SWE-bench موفق شد ۱۳٫۸۶ درصد موارد را بدون کمک انسانی بهدرستی حل کند. در مقام مقایسه، Claude 2 میتواند فقط ۴٫۸ درصد از کدها را بدون دخالت انسان حل کند و امتیاز Llama-13b و GPT-4 بهترتیب ۳٫۹۷ و ۱٫۷۴ درصد است.
Cognition توضیح نداده که دقیقاً چگونه به شاهکار خود، یعنی Devin، دست یافته است و نمیدانیم آیا این استارتاپ از مدل اختصاصی خود استفاده میکند یا از مدلهای سایر شرکتها.
دوین همچنان مراحل آزمایشی را میگذراند؛ اما تواناییهایش در انجام همهی مراحل برنامهنویسی باعث ایجاد مهمترین تمایز آن با دستیاریان برنامهنویسی مبتنیبر هوش مصنوعی سایر شرکتها شده است.
نظرات