تمام اطلاعاتی که برای درک سه فناوری‌ صدای بی‌اتلاف، با وضوح بالا و فراگیر نیاز داریم

دوشنبه ۳۱ خرداد ۱۴۰۰ - ۱۲:۰۰
مطالعه 18 دقیقه
در این مقاله به بررسی سه فناوری جذاب صدای بی‌اتلاف (lossless audio)، صدا با وضوح بالا (High-resolution audio) و صدای فراگیر (Spatial Audio) می‌پردازیم.
تبلیغات

اپل اخیراً گزینه صوتی بی‌اتلاف (lossless audio) را برای سرویس پخش استریم اپل موزیک معرفی کرده است این شرکت همچنین صدا با کیفیت بالای بی‌اتلاف و همچنین صدای فراگیر صوتی را با استفاده از انکدینگ دالبی اتموس ارائه می‌دهد.

اپل آخرین شرکتی است که این گزینه‌ را ارائه می‌دهد و به سرویس‌هایی مانند آمازون، تایدال، دیزر و کوبووز پیوسته است. حتی اسپاتیفای که هنوز چنین قابلیتی برای کاربران خود فراهم نکرده، چند ماه پیش با معرفی سرویس جذاب Spotify HiFi از اپل پیشی گرفته است.

به گزارش GSMArena، اپل در حال اعمال قابلیت صدای بی‌اتلاف در اکوسیستم خود است و با چنین اقدامی، اپل موزیک به‌صورت خودکار به بزرگ‌ترین سرویس پخش موسیقی برای ارائه این ویژگی تبدیل می‌شود. میلیون‌ها نفر بدون تلاش اضافه و حتی پرداخت هزینه، به راحت‌ترین شکل ممکن به صدای بی‌اتلاف دسترسی خواهند داشت.

بنابراین چند سؤال پیش می‌آید؛ صدای بی‌اتلاف چیست؟ چرا باید به آن اهمیت داد؟ صدای با وضوح بالا یا دالبی اتموس به چه معنی است؟

اکنون زمان آن رسیده است که به‌طور کامل این فناوری‌ها را توضیح بدهیم و برخی افسانه‌های مرتبط با آن‌ها را بررسی کنیم. در ادامه به‌طور کامل نکات مرتبط با این قابلیت جدید توضیح داده شده است.

کپی لینک

نکات پایه‌

صوتی که می‌شنویم آنالوگ است؛ زیرا دامنه‌ای است که گوش ما توانایی شنیدن آن را دارد. در گذشته رسانه‌هایی که این صدا را برای ما پخش می‌کردند نیز آنالوگ بودند. نوار کاست یک نمونه از این نوع رسانه‌های آنالوگ است که تا چندی پیش توسط علاقه‌مندان مورد استفاده قرار می‌گرفت.

اما ضبط صدا به‌صورت آنالوگ در رسانه محدودیت‌های شدیدی در کیفیت اطلاعات ضبط‌شده ایجاد می‌کند. چنین صفتی با دنیای فناوری که به‌طور فزاینده‌ای پیشرفت می‌کند، سازگار نیست. اینجا است که صدای دیجیتال وارد میدان ‌می‌شود.

یک سیگنال صوتی آنالوگ را می‌توان به‌صورت یک موج سینوسی پیوسته ساده نشان داد. برای نشان دادن این سیگنال آنالوگ در حوزه دیجیتال گسسته، از روشی به نام تعدیل کد پالس (PCM) استفاده می‌شود. امروزه اکثریت قریب به اتفاق صداهای دیجیتالی که ما می‌شنویم، از این روش استفاده می‌کنند.

مدولاسیون کد پالس یا مدولاسیون کد جدید پالس خطی (LPCM)، با گرفتن نمونه‌های گسسته در زمان و دامنه روی موج سینوسی آنالوگ یادشده کار می‌کند. کیفیت فرایند تبدیل آنالوگ به دیجیتال به تعداد دفعات و تعداد مقادیر دیجیتال احتمالی قابل استفاده برای نشان دادن هر نمونه (عمق بیت) بستگی دارد. از نظر تئوری، هرچه این مقادیر بالاتر باشد، سیگنال دیجیتال به ارائه‌ی صدای اصلی آنالوگ نزدیک‌تر خواهد بود.

از آنجا که نمونه‌‌ها در نقاط گسسته روی یک سیگنال مداوم گرفته می‌شوند، برای پر کردن شکاف‌ها فرآیندی به نام کوانتیزه لازم است که از تکنیک‌هایی مانند گرد کردن و کوتاه کردن استفاده می‌کند؛ اما این فرایند به صدا نویز اضافه می‌کند که مقدار آن در سیگنال تبدیل‌شده با عمق بیت متناسب است. به همین ترتیب، افزایش عمق بیت سیگنال دیجیتال، عملکرد کاهش نویز و در نتیجه افزایش دامنه دینامیک را به همراه دارد.

البته بیشتر مواقع صدای دیجیتالی که امروزه می‌شنویم مملو از نویز پس‌زمینه نیست؛ این به خاطر استفاده از تکنیک زیرکانه‌ای به نام Dithering است. این روش جایگزین الگوی نویز طبیعی شده که نتیجه آن فرایند کوانتاسیون با الگوی نویز انتخابی ما است. این قابلیت به ما امکان می‌دهد نویز مورد نظر خود را در هر مکان از طیف فرکانسی داشته باشیم. با Dithering می‌توانیم نویز تدریجی را با یک نویز سازگارتر که کمتر قابل شنیدن است، جایگزین و آن را به قسمت‌هایی از پاسخ فرکانسی که گوش ما به آن حساسیت کمتری دارد، منتقل کنیم.

اکنون که صحبت از پاسخ فرکانسی شد، باید به این مسئله اشاره کرد که گوش ما به امواج صوتی که در محدوده ۲۰ هرتز تا ۲۰ هزار هرتز قرار دارند حساس است. البته مقدار گفته‌شده کمی با واقعیت تفاوت دارد؛ به این معنی که بیشتر افراد، به‌ویژه در مناطق بالاتر طیف، دامنه کمتری نسبت به این مقدار دارند. علاوه بر این، با افزایش سن، این دامنه به‌طور طبیعی کاهش می‌یابد و افراد مسن کمتر از دامنه فرکانس بالاتر می‌شنوند؛ اما برای بحث این مقاله با پیش‌فرض دامنه عمومی ۲۰ الی ۲۰ هزار هرتز پیش می‌رویم.

برای اطمینان از اینکه صداهای ضبط‌شده حداقل تا فرکانس‌های ۲۰ هزار هرتز را پوشش می‌دهند، نرخ نمونه‌برداری (Sample Rate) باید حداقل دو برابر آن باشد؛ این مسئله توسط اصلی به نام قضیه نمونه‌برداری Nyquist-Shannon توضیح داده می‌شود. این اقدام برای جلوگیری از ایجاد سیگنال‌های اشتباه هنگام تبدیل دیجیتال به آنالوگ انجام می‌شود. این بدان معنا است که برای دستیابی به حداکثر فرکانس ۲۰ هزار هرتز یا ۲۰ کیلوهرتز، به نرخ نمونه‌برداری حداقل ۴۰ کیلوهرتز نیاز دارید.

استاندارد صوتی دیجیتال امروزه، سی‌دی صوتی است که از ۱۶ بیت اطلاعات با نرخ نمونه‌برداری ۴۴٫۱ کیلوهرتز در LPCM فشرده‌نشده استفاده می‌کند. با اینکه سی‌دی بیش از ۴۰ سال سن دارد؛ اما همچنان استاندارد طلایی در صدای دیجیتال محسوب می‌شود.

اما به همان اندازه که سی‌دی صوتی هنوز خوب است، به دلیل حجم فایل زیاد، استریم یا دانلود آن چندان مناسب نیست. این مسئله به‌ویژه در روزهای ابتدایی اینترنت و موسیقی آنلاین بسیار جدی تلقی می‌شد؛ زیرا سرعت اینترنت در آن زمان بسیار کم بود. این امر منجر به اختراع صدای فشرده (Compressed audio) شد که در نهایت دنیای صوتی را تصاحب کرد.

فشرده‌سازی یک روش معمول در رایانش برای کاهش اندازه فایل است. هنگامی که یک فایل زیپ ایجاد می‌کنید، در حال فشرده‌سازی آن هستید تا فضای کمتری روی دیسک اشغال کند. زیپ مثالی از فشرده‌سازی بی‌اتلاف است که می‌تواند به حجم کمتر برسد؛ اما محدودیت‌هایی نیز دارد. ولی اگر می‌خواهید این محدودیت‌ها کنار برود باید بعضی دیتاها از بین بروند.

اگر برنامه بایگانی سیستم هنگام ساخت فایل زیپ شروع به حذف داده‌های تصادفی کند، احتمالاً خیلی از این مسئله خشنود نخواهید شد؛ اما صدا متفاوت عمل می‌کند. حتی صدای استاندارد سی‌دی دارای اطلاعات زیادی است که گوش انسان اغلب نمی‌تواند آن را درک کند؛ شنیدن این موارد ممکن است بسته به شخص و تجهیزات مورد استفاده تغییر کند. با توجه به این حقیقت، تنها با کنار گذاشتن بیت‌هایی که اهمیت چندانی ندارند، فشرده‌سازی فایل آسان می‌شود.

تکنیک‌های فشرده‌سازی اولیه خیلی عالی نبودند. اکثر ما فایل‌های Mp3 قدیمی را به خاطر داریم. با گذشت زمان، اوضاع بهتر شد. کدک‌های بهتر و کارآمدتری در اختیار ما  قرار گرفت که می‌توانستند داده‌های بیشتر را در فضای کمتری ذخیره کنند. از همه مهم‌تر، در حال حاضر انکدینگ‌های بهتری داریم؛ بنابراین داده‌ها می‌توانند به‌طور مؤثرتری پک شوند. امروزه صدای فشرده در همه جا وجود دارد. هر سرویس پخش موسیقی از آن استفاده می‌کند، هر سرویس استریم ویدئو از آن برخوردار است و حتی فرمت‌های دیگر مانند کتاب‌های صوتی و پادکست‌ها به آن مجهز هستند. هر ویدیویی که به وسیله گوشی هوشمندی خود ضبط کرده‌اید دارای صدای فشرده‌شده است. این قابلیت به حدی خوب است که اکثر مردم حتی متوجه نمی‌شوند موسیقی آن‌ها فشرده شده است؛ حتی اگر در گذشته نسخه اصلی را شنیده باشند.

همین مسئله ما را به موضوع بعدی وصل می‌کند.

کپی لینک

صدای بی‌اتلاف چیست و چرا باید به آن اهمیت داد

در ابتدای این بخش، موضوع مذکور را کاملاً صریح و روشن بیان می‌کنیم: بی‌اتلاف به معنای فشرده نبودن نیست. مردم غالباً از این اصطلاحات به جای یکدیگر استفاده می‌کنند و قطعاً منظور آن‌ها یک معنی نیست.

همان‌طور که قبلاً ذکر شد، می‌توانید به دو حالت عملیات فشرده‌سازی را انجام بدهید. اول اینکه همه چیز را به گونه‌ای فشرده کنید که برخی داده‌ها حذف و اندازه فایل به طرز قابل توجهی کوچک‌تر شود. با گزینه دوم می‌توانید فایل را به گونه‌ای فشرده کنید که تمام داده‌ها حفظ شود و حجم آن نسبتا کاهش یابد. حالت دوم فشرده‌سازی بی‌اتلاف است.

صدای بی‌اتلاف صوتی است که با استفاده از تکنیک‌هایی که تمام داده‌های موجود در فایل اصلی را حفظ می‌کند، فشرده شده است. نتیجه این فرایند، نسخه‌ای است که دانلود و استریم آن در مقایسه با فایل اصلی فشرده‌نشده، از طریق اینترنت راحت‌تر است.

مزایای این امر باید برای بسیاری روشن باشد. تکنیک‌های فشرده‌سازی بااتلاف طی سال‌های گذشته بهبود یافته‌اند و اکنون به حدی رسیده‌اند که حتی با تجهیزات مدرن اکثر افراد نمی‌توانند بین صدای فشرده‌شده و فایل صوتی اصلی تفاوتی قائل شوند؛ اما آن‌ها صوت اصلی نیستند.

این بدان معنی است که برای کسانی که واقعا شنوایی خوبی دارند، تجهیزات مناسبی استفاده می‌کنند و می‌توانند تفاوت صدای فشرده‌شده بااتلاف و بی‌اتلاف را تشخیص بدهند یا حتی صرفا قصد دارند نسخه بدون تغییر را برای اهداف بایگانی نگه‌داری کنند، اکنون این امکان وجود دارد که به نسخه بی‌اتلاف گوش بدهند.

دلیل اصلی اختراع کدک‌های بااتلاف، سهولت انتشار فایل‌ها از طریق اینترنت بود؛ اما با افزایش پهنای باند در اکثر نقاط جهان، دستگاه‌های محاسباتی سریع‌تر و به‌طور کلی فضای ذخیره‌سازی بیشتر، استفاده از نسخه‌های فشرده‌شده بی‌اتلاف از همیشه آسان‌تر شده است. سرویس‌های استریم همچنین مسئله ذخیره‌سازی را تا حدودی از بین برده‌اند؛ زیرا موسیقی دیگر نیازی به ذخیره محلی ندارد و می‌تواند بر اساس فضای ابری به دست کاربر برسد.

حتی اگر دانش کافی موسیقی یا تجهیزات لازم برای شنیدن یک قطعه با جزئیات کامل ندارید اما اینترنت پرسرعت نامحدود در دسترس شما است، چرا باید به نسخه فشرده گوش کنید؟

این مسئله تقریبا منطقی است که پشت صدای بی‌اتلاف قرار دارد. از لحاظ عملی لزوما بهترین نسخه نیست بلکه صرفا صدای اورجینال است؛ درست مانند سال‌های گذشته که فایل‌ صوتی از طریق سی‌دی ارائه می‌شد. بله، به‌نوعی اکنون باز هم به سی‌دی صوتی رسیده‌ایم و کمی عجیب به نظر می‌رسد که چرا نسخه‌ فشرده بی‌اتلاف آن‌قدر طرفدار دارد؛ درصورتی‌که در حقیقت همان صدای سی‌دی است. فناوری درواقع چرخشی انجام داده و به نسخه پیشین بازگشته و صرفا سی‌دی را حذف کرده است.

البته لزوما صوت ‌بی‌اتلاف نباید صدای سی‌دی باشد. بعضی از شرکت‌ها به نسخه‌هایی از یک صوت که کیفیت بالای دارند «کیفیت سی‌دی» می‌گویند؛ اما ممکن است جزو آن دسته افرادی باشید که دیگر صدای سی‌دی برای آن‌ها به اندازه کافی خوب نیست. اینجا است که غول نهایی کیفیت صدای دیجیتال ظاهر می‌شود.

کپی لینک

صدا با وضوح بالا چیست

مانند بخش قبلی، قصد داریم این قسمت را نیز با توضیحات شروع کنیم. وضوح بالا به معنای بی‌اتلاف و بی‌اتلاف به معنای وضوح بالا نیست. وضوح بالا می‌تواند در فرمت‌های بی‌اتلاف و بااتلاف باشد. صدای بی‌اتلاف می‌تواند با وضوح کم یا زیاد باشد. این دو مسئله از هم متمایز هستند.

اپل آهنگ‌های با وضوح بالا را در همان کدک ALAC بی‌اتلاف که مانند فایل‌های با کیفیت سی‌دی هستند ارائه می‌کند. آمازون کدک خود را مشخص نکرده است؛ اما برای فایل‌های با کیفیت بالا و کیفیت سی‌دی، نسخه بی‌اتلاف ارائه می‌دهد. از طرف دیگر، تایدال آهنگ‌های با کیفیت سی‌دی خود را در کدک FLAC بی‌اتلاف به گوش مخاطبان می‌رساند؛ اما آهنگ‌های با وضوح بالا در کدک MQA بااتلاف ارائه می‌شوند.

پس صدا با وضوح بالا چیست؟ برای این منظور، ما باید به مفهوم قدیمی‌تر نگاهی بیندازیم: عمق بیت و نرخ نمونه‌گیری. وضوح بالا تنها موارد بیشتری از آن‌ها را دارد؛ بیت‌های بیشتر و سمپل‌های بیشتر. وضوح بالا معمولاً حداقل ۲۴ بیت دامنه دینامیک و نرخ نمونه‌برداری ۸۸٫۲ کیلوهرتز دارد؛ اما در بعضی موارد می‌تواند به ۱۹۲ یا حتی ۳۸۲ کیلوهرتز برسد.

از صدای با وضوح بالا گاهی اوقات به‌عنوان صدای با کیفیت بالا نیز یاد می‌شود. سپس Hi-Res Audio وجود دارد که در واقع یک نام تجاری متعلق به سونی است و دیگران می‌توانند با استفاده از آن نشان بدهند که دستگاه‌هایشان از صوت با وضوح بالا پشتیبانی می‌کنند؛ اما این امری ضروری نیست و می‌توانید سخت‌افزار صوتی با وضوح بالا بدون این مارک نیز داشته باشید.

این نوع صدا مدتی است که به میدان آمده و اولین روزهای آن را می‌توان به دوران Super Audio سی‌دی نسبت داد. مسئله این است که به نظر می‌رسد اکثر مردم، از جمله مهندسان صدا و علاقه‌مندان به موسیقی، نمی‌توانند در مورد اینکه آیا وضوح بالا یک گزینه مفید است یا صرفا یک ویژگی اضافه، به توافق برسند. این کیفیت نه‌تنها می‌تواند تمام محدوده شنوایی متوسط ​​انسان را در بر بگیرد، بلکه این کار را به روشی انجام می‌دهد که بهبود آن عملاً کار بسیار دشواری به نظر می‌رسد.

بیایید به اولین مزیت صوت با وضوح بالا که عمق بیت بالاتر است، نگاهی بیندازیم. زمانی که عمق بیت آنالوگ را به دیجیتال کاهش ‌می‌دهید، برای تبدیل دوباره آن به آنالوگ باید نویز بیشتری در فرایند کوانتاسیون اضافه کنید. با افزایش عمق بیت، به‌طور طبیعی نویز را کاهش می‌دهید و در نتیجه دامنه دینامیک افزایش می‌یابد.

اما حتی با ۱۶ بیت Undithered، می‌توانید یک دامنه پویای ۹۶ دسی‌بلی به دست آورید که تقریباً به بیشینه محدودیت شنوایی انسان (۱۲۰ دسی‌بل) نزدیک است. این صوت می‌تواند تا حدی پیش برود که از این دامنه عبور کند؛ به عبارت دیگر، شما نمی‌توانید آن را بشنوید.

در مرحله دوم، تکنیک‌های هوشمندانه مانند Dithering می‌تواند به کاهش و شکل‌گیری نویز حتی در سیگنال ۱۶ بیتی کمک کند؛ به‌طوری‌که برای هر چیزی غیر از تجهیزات دقیق، غیر قابل شنیدن باشد. دامنه دینامیک سیگنال ۱۶ بیتی به‌راحتی می‌تواند با کاهش و تغییر شکل نویز در محدوده قابل شنیدن، از ۱۲۰ دسی‌بل فراتر برود. این بدان معنا است که برای همه اهداف عملی، ۱۶ بیت کاملاً مناسب گوش انسان است.

مزیت دیگر رزولوشن بالا، نرخ نمونه‌برداری بالاتر است. نرخ نمونه‌برداری ۱۹۲ کیلوهرتز به این معنی است که صدا می‌تواند سقف پاسخ فرکانسی تا ۹۶ کیلوهرتز داشته باشد. همان‌طور که قبلاً اشاره شد، انسان‌ها فقط می‌توانند ۲۰ کیلوهرتز را بشنوند؛ البته این بازه صرفا برای کسانی است که در روزهای جوانی خود هستند و هیچ مشکل شنوایی ندارند. پاسخ شنوایی اکثر مردم حتی فرکانس پایین‌تر  از مقدار گفته شده است.

فرکانس‌ صوتی فراتر از محدوده شنیداری انسان، مانند تلویزیونی است که نور خارج از محدوده مرئی نشان می‌دهد. شما می‌توانید صدای ۹۶ کیلوهرتزی را تقریبا همان‌طور بشنوید که اشعه ایکس را می‌بینید؛ یعنی اصلا این امکان وجود ندارد.

تولید اصواتی با فرکانس‌های بالا می‌تواند تجهیزات و درایورها را تحت فشار قرار بدهد و اعوجاج اضافه ایجاد کند و این اعوجاج قطعاً در محدوده شنیداری انسان است. برخی افراد اظهار داشته‌اند که فرکانس‌های فراتر از بازه شنوایی انسان بر فرکانس‌هایی که می‌توانیم بشنویم تأثیر می‌گذارند؛ بنابراین داشتن این فرکانس‌های اضافه می‌تواند صدای بیت‌های قابل شنیدن را بهبود ببخشد؛ اما اتفاق نظر واقعی در این مورد وجود ندارد.

نکته اینجا است که بالا بودن عمق بیت و نرخ نمونه‌برداری هردو مزیت‌های خاص خود را دارند؛ اما این امر اساسا هنگام ساخت موسیقی در درجه اول قرار می‌گیرد؛ مانند کار با تصویر دارای فرمت RAW، کار روی آهنگی که عمق بیت بیشتری دارد آسان‌تر است و تنظیمات مربوط به آن سریع‌تر انجام می‌شود. مزیت اصلی آن داشتن نویز پایه کم‌تر است که می‌تواند هنگام لایه‌بندی چندین آهنگ، دردسر ایجاد کند؛ در نتیجه اگر همه لایه‌ها ۲۴ بیتی یا بالاتر باشند، نویز پایه کم‌تر از حالات دیگر خواهد بود. این امر درباره نرخ نمونه‌برداری و پاسخ فرکانس بالاتر نیز صدق می‌کند. به محض اینکه کار ساخت موسیقی به پایان برسد، می‌توانید از آن خروجی ۱۶ بیت بگیرید و هنوز هم یک نمونه عالی در اختیار داشته باشید.

در حال حاضر دشوار است که به‌طور قطع گفت آیا وضوح بالا برای صرفا گوش دادن به موسیقی فواید ملموسی دارد یا خیر. اکثر افرادی که ادعا می‌کنند هنگام گوش دادن به موسیقی تفاوتی حس کرده‌اند، ممکن است در حال گوش دادن به نسخه‌ دیگری از آن باشند. در حال حاضر بسیاری از موسیقی‌های منتشرشده با وضوح بالا، بازسازی‌شده‌ هستند که این امر می‌تواند موجب بروز تغییرات زیادی شود. نکته‌ای که در اینجا تفاوت ایجاد می‌کند، مسترینگ است که اغلب در سال‌های گذشته کم‌رنگ بود. دلیل اینکه چرا بسیاری از موسیقی‌های قدیمی، بازسازی و دوباره منتشر می‌شوند همین مسئله است. این مسئله حتی در صدای استاندارد سی‌دی صدق می‌کند، پس اگر قصد مقایسه داشتید، مطمئن شوید در هر دو فرمت از مستر یکسانی استفاده شده است.

صوت‌های وضوح بالا به دلیل اینکه شرکت‌های استریم موسیقی و فروش سخت‌افزار برای پشتیبانی از این کیفیت کاربران را مجبور به پرداخت هزینه سنگین می‌کنند، شهرت بسیار خوبی ندارند. پیش از این، بیشتر مبدل‌های دیجیتال به آنالوگ (DAC) فقط تا ۱۶ بیت و ۴۸ کیلوهرتز پشتیبانی می‌کردند. حتی امروزه، این همان چیزی است که می‌توانید در اکثر تلفن‌های هوشمند و رایانه‌ها پیدا کنید. به همین دلیل اپل هنگام پخش فایل‌های دارای وضوح بالا در اپل موزیک، استفاده از DAC خارجی را توصیه می‌کند.

باید به این مسئله اشاره کرد که طی دو سال گذشته اوضاع به‌طور قابل توجهی بهبود یافته است. این روزها می‌توانید حتی تلفن‌های هوشمند ارزان‌قیمتی تهیه کنید که توانایی دیکود سیگنال ۲۴ بیتی و ۱۹۲ کیلوهرتزی دارند. اکنون DAC-های باکیفیت برای استفاده در دسکتاپ از هر زمان دیگری ارزان‌تر هستند و می‌توانید تنها با پرداخت حدود ۱۰۹ دلار آن را به همراه یک تقویت‌کننده داخلی عالی خریداری کنید. تنها محدودیت امکان یافتن محتوای صوتی با وضوح بالای کافی است؛ زیرا هنوز این بخش مشکلاتی دارد.

کپی لینک

صدای فراگیر چیست

در اعلامیه مربوط به صدای بی‌اتلاف اپل موزیک، بخش دیگری درباره قابلیتی به نام صوت فضایی بود. درواقع  این شرکت ادعا می‌کند که با دالبی اتموس از صدای فضایی پشتیبانی می‌کند؛ اما این مسئله به چه معنا است؟

ابتدا بیایید درباره دالبی اتموس بحث کنیم. دالبی به داشتن چندین کدک صدای فراگیر معروف است و یکی از شناخته‌شده‌ترین نام‌ها در دنیای صدای سینمایی است. با این وجود، فرمت‌های صدای فراگیر سنتی دارای پشتیبانی کانال مجزا مانند ۵٫۱ یا ۷٫۱ هستند. این بدان معنی است که هنگام مسترینگ در این فرمت‌ها، اصوات باید بر اساس خواسته کارگردان در کانال‌های مورد نظر قرار بگیرند.

دالبی اتموس به جای صدای مبتنی بر کانال، صدای مبتنی بر شیء را معرفی کرد. این بدان معنی است که هنگام مسترینگ، مهندس صدا فقط باید فایل را در یک فضای سه‌بعدی در اطراف شنونده قرار بدهد و سپس سیستم متوجه می‌شود که باید از کدام بلندگوها برای تولید صدا استفاده کند. این همچنین به این معنی است که اتموس از لحاظ نظری تعداد نامحدودی کانال دارد؛ زیرا همیشه می‌توان بلندگوهای بیشتری برای افزایش غوطه‌وری صدا اضافه کرد؛ کاری که نمی‌توانید با فرمت‌های ثابت مبتنی بر کانال انجام بدهید.

اتموس یک قدم جلوتر می‌رود و عنصر ارتفاع را به صدا اضافه می‌کند؛ به این معنی که اکنون می‌توانید صدا را به‌گونه‌ای انکود کنید که به نظر برسد از بالای سر پخش می‌شود. این ویژگی باعث می‌شود صدا به مقدار قابل توجهی دارای عنصر غوطه‌وری بیشتری باشد؛ زیرا اکنون شنونده توانایی شنیدن اصوات از همه جهات را دارد.

دالبی اتموس برای موسیقی از همین روش استفاده می‌کند. این ویژگی به آهنگساز اجازه می‌دهد موسیقی را به‌گونه‌ای تنظیم کند که هنگام گوش دادن به آن از همه جهات و ارتفاع‌های مختلف شنیده شود؛ بنابراین احساس می‌کنید که در موسیقی غوطه‌ور هستید و واقعا در آنجا حضور دارید. کافی است تصور کنید که چگونه می‌توان از چنین قابلیتی برای ضبط اجرای زنده و انتشار آن استفاده کرد.

اپل از دالبی اتموس استفاده کرده است و از طریق فناوری صدای فراگیر خود آن را تغذیه می‌کند. قابلیت صدای فراگیر هنگام جفت شدن ایرپاد پرو و ایرپاد پرو مکس با دستگاه‌های اپل در دسترس کاربران قرار می‌گیرد. هنگام پخش محتوای دالبی اتموس در آیفون یا آیپد، ایرپاد پرو و مکس از داده‌های موجود در آهنگ برای شبیه‌سازی یک کره سه‌بعدی صدا در اطراف کاربر استفاده می‌کند. علاوه بر این، از شتاب‌سنج و ژیروسکوپ در این مدل‌های ایرپاد استفاده شده است؛ در نتیجه آن‌ها حرکت سر کاربر را ردیابی می‌کنند؛ به‌طوری‌که صدا با سر او حرکت می‌کند.

اپل موزیک با داشتن قابلیت صدای فراگیر باعث می‌شود موسیقی در اطراف شما پخش شود؛ اما نمی‌تواند سر را ردیابی کند. از آن‌جایی که ردیابی سر در این اپلیکیشن انجام نمی‌شود، می‌توان با مدل‌های پایه ایرپاد نیز از آن استفاده کرد. در واقع، قابلیت صدای فراگیر روی تمام مدل‌های ایرپاد و بیتس که دارای تراشه‌های W1 یا H1 هستند و بلندگوهای داخلی تمام مدل‌های آیفون، آیپد و مک با بلندگوهای استریو کار می‌کند.

حال سؤال اصلی این است، آیا واقعا صدای فراگیر قابلیت خوبی است؟ متأسفانه بعضی از افرادی که از این ویژگی استفاده کرده‌اند، به آن دیدگاه خوبی ندارد.

این مشکل به خود فرمت ارتباطی ندارد؛ بلکه بیشتر به ضبط موسیقی مربوط می‌شود. گاهی اوقات ممکن است با موسیقی‌هایی مواجه شوید که به‌طور خاص برای نشان دادن صدا صوتی فراگیر طراحی شده‌اند و این مسئله عموماً برای شنونده جالب است؛ اما بارها توسط افراد مختلف تجربه شده است که موسیقی‌هایی که هدف اصلی آن‌ها نشان دادن قابلیت مذکور نیست، هنگام شنیده شدن جالب به نظر نمی‌رسند. این امر خصوصاً در مورد آلبوم‌های استودیویی صدق می‌کند که از ابتدا به گونه‌ای طراحی شده‌اند که در بلندگوهای استریوی معمولی پخش شوند؛ ولی هنگامی که در حالت صدای فراگیر شنیده می‌شوند عجیب و غریب به نظر می‌رسند. ترجیح بسیاری از افرادی که به‌طور عمومی موسیقی گوش می‌دهند، استفاده از نسخه استاندارد استریو است.

البته نباید این نکته را فراموش کرد که قابلیت صدای فراگیر چقدر برای ضبط کنسرت‌ کارآمد است. در پایان باید گفت می‌توان به این فناوری امیدوار بود؛ زیرا می‌تواند در آینده پیشرفته‌تر شود؛ اما اگر سخت‌افزار لازم برای شنیدن این نوع صدا را ندارید نگران نباشید؛ زیرا چیز زیادی از دست نمی‌دهید.

کپی لینک

صدای بلوتوث چطور کار می‌کند

تا به اینجای مقاله بیشتر در مورد صداهایی که با کابل منتقل می‌شوند صحبت شد؛ اما امروز بسیاری از مردم موسیقی را از طریق دستگاه‌های مجهز به بلوتوث گوش می‌دهند، از ایرپاد اپل و ایرباد سونی گرفته تا بلندگوهای بلوتوثی یا ضبط‌ خودروهای جدید.

بلوتوث لایه‌ای اضافه از پیچیدگی را به فرایند پخش صدا اضافه می‌کند. نکته مهم این است که تمامی صداهایی که توسط بلوتوث پخش می‌شوند،‌ فشرده‌ هستند. هر کدک بلوتوث که امروز در دسترس است، اعم از SBC پایه برای AAC ،aptX ،aptX HD ،LDAC ،LHDC و کدک مقیاس‌پذیر سامسونگ، همگی بااتلاف هستند.

اکنون زمان آن رسیده است که یکی از افسانه‌های پرطرفدار دنیای هدست‌های بلوتوث را تکذیب کنیم. اگر موسیقی در حالت AAC باشد و هدفون بلوتوث نیز از AAC برای انتقال صدا استفاده کند، موسیقی همچنان فشرده و انکود می‌شود. در حال حاضر انتقال صدا از طریق بلوتوث بدین شکل کار می‌کند. این فناوری نه‌تنها پهنای باند لازم برای انتقال بی‌اتلاف با کدک‌های موجود را ندارد، بلکه انتقال فشرده‌نشده توسط آن امکان‌پذیر نیست. ممکن است روزی یک کدک جدید ایجاد شود که بسیار کارآمد باشد و بتواند همه داده‌های اصلی را بدون حذف قسمتی، پک و فایل را از طریق پهنای باند کوچک بلوتوث ارسال کند؛ اما هنوز این اتفاق نیفتاده است.

بسته به کدکی که برای انتقال بلوتوث استفاده می‌شود‌، می‌توانید نتایج بسیار خوبی به‌ دست آورید؛ مخصوصاً اگر مقدار بیت کدک بلوتوث بسیار بیشتر از فایل صوتی شما باشد. اما اگر در حال گوش دادن به صدای بی‌اتلاف باشید، تنها اطلاعاتی که کدک بلوتوث توانایی انتقال آن‌ها را دارد، حفظ خواهند شد. البته در نهایت اینکه آیا متوجه تفاوت‌های موجود میان نسخه‌های مختلف می‌شوید یا خیر، مسئله دیگری است.

کپی لینک

نتیجه‌گیری

کلمات زیادی در این مقاله وجود دارد و اگر ذهن کنجکاوی داشته باشید ممکن است به کارتان بیایند. اما در پایان، موسیقی بیش از مجموع بیت‌ها و موج‌های سازنده آن است. هدف از گوش دادن به موسیقی یا هر قطعه صوتی لذت بردن از آن است.

برای برخی افراد جدا کردن جنبه فنی موسیقی و مطالعه جزئیات آن بخشی از تجربه گوش دادن است. افرادی هستند که با تجزیه و تحلیل هر صوت، به علم تجربی خود در این زمینه اضافه می‌کنند. آن‌ها اطمینان حاصل می‌کنند که تمام تجهیزات به‌درستی کار کنند، تمام عمق بیت‌ها و نرخ نمونه‌برداری‌ صحیح و با صدای منبع سازگار باشند. این افراد تمام مسیر موسیقی را نگاه می‌کنند تا تمام المان‌های موجود تا مرحله نهایی بررسی شوند.

اگر این‌چنین هستید، مواردی مانند صدای بی‌اتلاف و صدای با وضوح بالا برایتان مناسب است. هنوز هستند کسانی که حتی اگر به آن‌ها بگوییم سیستم‌های امروزی به اندازه کافی خوب هستند و می‌توان با آن‌ها تجربه مناسبی از گوش دادن به موسیقی داشت، باز هم برای شنیدن بهترین کیفیت از هدفون‌ سیمی، DAC خارجی و آمپلی‌فایر استفاده می‌کنند.

اما گاهی برایمان مهم نیست که آیا توانایی تشخیص نسخه‌های مختلف صدا از یکدیگر را داریم. مهم‌ترین مسئله لذت بردن از صدا است؛ در نتیجه اگر حس خوبی به موسیقی دارید، از آن لذت ببرید.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات