متا احتمالاً دو هوش مصنوعی «کوچک» Llama 3 را بهزودی رونمایی میکند
براساس گزارش جدید وبسایت اینفورمیشن، متا قصد دارد دو نسخهی کوچک از لاما ۳ را قبل از پایان ماه جاری میلادی و در آستانهی انتشار مدل اصلی در تابستان، منتشر کند.
اقدام جدید متا با هدف خدمترسانی به آن دسته از توسعهدهندگان هوش مصنوعی است که نیازمند مدلهای سبک هستند. درحالحاضر، متا نسخهای کوچکتر از مدل لاما ۲ به نام Llama 2 7B دارد که سال گذشته منتشر شد.
مدلهای زبانی سبک معمولاً نمیتوانند رشتههای طولانی متن را پردازش کنند؛ اما سریعتر و ارزانتر هستند. این مدلها بهاندازهی کافی قدرتمند هستند و میتوانند فایلهای پیدیاف و مکالمات را خلاصه کنند و کد بنویسند.
مدلهای زبانی بزرگتر معمولاً برای کارهای پیچیدهتر یا کارهای نیازمند به چندین دستور برای اجرا استفاده میشوند. مدلهای کوچک با تعداد کمتری از پارامترها کار میکنند. این پارامترها نیز به قدرت محاسباتی کمتری نیاز دارند؛ بنابراین، مقرونبهصرفهترند.
مدلهای سبک میتوانند در پروژههای خاصی مانند کمک در کدنویسی یا در دستگاههایی مانند گوشیها یا لپتاپها پیادهسازی شوند که توان پردازش مدلهای هوش مصنوعی بزرگتر را ندارند.
متا لاما ۳ را در جولای ۲۰۲۴ (تیر و مرداد ۱۴۰۳) منتشر میکند. احتمالاً این نسخه به سؤالات بحثبرانگیزی جواب میدهد که لاما ۲ اجازه نداشت به آنها پاسخ دهد.
نظرات