هوش مصنوعی MusicGen متا، متن را به موسیقی تبدیل می‌کند

سه‌شنبه ۲۳ خرداد ۱۴۰۲ - ۱۲:۰۰
مطالعه 2 دقیقه
‌هوش مصنوعی آهنگ ساز
متا مدل هوش مصنوعی منبع‌باز دیگری منتشر کرده که براساس صدها هزار آهنگ آنلاین آموزش داده شده است.
تبلیغات

هوش مصنوعی در بسیاری از حوزه‌های هنری نفوذ کرده و اکنون در صنعت موسیقی نیز کاربرد دارد. متا هوش مصنوعی منبع‌بازی به‌ نام MusicGen را منتشر کرده که روش کار آن مشابه ChatGPT بوده و با دریافت دستورات ساده، موسیقی تولید می‌کند.

فلیکس کروک، مهندس تحقیقات هوش مصنوعی متا، اواخر هفته‌ی قبل برخی قابلیت‌های MusicGen را به‌ نمایش گذاشت. این سیستم می‌تواند موسیقی‌های مختلف را دریافت کرده و آن‌ها را تغییر دهد. به‌عنوان مثال می‌توانید با این هوش مصنوعی براساس یک آهنگ کلاسیک، آهنگ پاپ جدیدی به سبک آثار دهه‌‌ی ۱۹۸۰ تولید کنید.

کروک توضیح می‌دهد مدل هوش مصنوعی جدید متا از توکنایزر صوتی EnCodec براساس مدل زبان ترانسفورماتور استفاده می‌کند. کاربران می‌توانند MusicGen را ازطریق API Hugging Face نمایش دهند. هرچند با توجه به تعداد کاربرانی که به‌طور همزمان از این سیستم استفاده می‌کنند، امکان دارد تولید موسیقی کمی طول بکشد. می‌توان از سایت Hugging Face برای ساخت نمونه‌ای از مدل به‌منظور دریافت خروجی‌های سریع‌تر استفاده کرد. در غیر این‌ صورت، اگر دانش لازم را داشته باشید، امکان دانلود و اجرای کد دردسترس شما خواهد بود.

گیزدمودو هوش مصنوعی MusicGen متا را برای بازخوانی سمفونیک تم تولدت مبارک و یک آهنگ هیپ هاپ آزمایش کرد که البته هیچ متنی به‌طور پیش‌فرض در آهنگ‌ها وجود نداشت.

هنوز مشخص نیست هوش مصنوعی جدید متا، چقدر آهنگ‌سازان خاص را درک می‌کند. به‌عنوان مثال نمی‌توان اعلام کرد آیا این ابزار می‌تواند براساس آثار هانس زیمر، موسیقی تولید کند یا خیر.

اگرچه طی ماه‌های اخیر مدل‌های هوش مصنوعی مختلفی برای تولید متن، تصویر و حتی ویدیو ارائه شده است؛ تا این‌ لحظه نمونه‌ای باکیفیت برای تولید موسیقی دردسترس قرار ندارد. با توجه به سند تحقیقاتی Preprint arXiv، یکی از چالش‌های مهم موسیقی، اجرای طیف فرکانس کامل است و این یعنی به نمونه‌برداری بسیار بیشتر نیاز دارد.

متا سیستم خود را با مدل MusicLM گوگل که برای تبدیل متن به موسیقی طراحی شده، مقایسه کرد.

گفته می‌شود MusicGen روی ۲۰ هزار ساعت موسیقی مجاز از مجموعه داده‌های داخلی شامل ۱۰ هزار آهنگ آموزش داده شده و همین موضوع، برخی هنرمندان را نگران کرده است. علاوه‌براین، متا از حدود ۳۹۰ هزار آهنگ Shutterstock و Pond5 برای بهبود آموزش مدل هوش مصنوعی جدیدش بهره گرفته و محققان این شرکت می‌گویند منابع مذکور با توافق قانونی مورد استفاده قرار گرفته‌اند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات