El gran mito del audio: por qué no necesita ese DAC de 32 bits

Autor: Randy Alexander
Fecha De Creación: 1 Abril 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
El gran mito del audio: por qué no necesita ese DAC de 32 bits - Tecnologías
El gran mito del audio: por qué no necesita ese DAC de 32 bits - Tecnologías

Contenido


Como probablemente haya notado, hay una nueva tendencia en la industria de los teléfonos inteligentes de incluir chips de audio de "calidad de estudio" dentro de los teléfonos inteligentes insignia modernos. Si bien un DAC de 32 bits (convertidor digital a analógico) con soporte de audio de 192 kHz ciertamente se ve bien en la hoja de especificaciones, simplemente no hay ningún beneficio en aumentar el tamaño de nuestras colecciones de audio.

Estoy aquí para explicar por qué esta jactancia de profundidad de bits y frecuencia de muestreo es solo otra instancia de la industria del audio que aprovecha la falta de conocimiento del consumidor e incluso de los audiófilos sobre el tema. Ponte tus gorros nerd, vamos a entrar en algunos puntos técnicos serios para explicar los entresijos del audio profesional. Y espero que también le demuestre por qué debe ignorar la mayor parte de la publicidad de marketing.

¿Escuchas eso?

Antes de profundizar, este primer segmento ofrece información de fondo requerida sobre los dos conceptos principales de audio digital, profundidad de bits y frecuencia de muestreo.


La frecuencia de muestreo se refiere a la frecuencia con la que vamos a capturar o reproducir información de amplitud sobre una señal. Esencialmente, cortamos una forma de onda en muchas partes pequeñas para aprender más sobre ella en un momento específico. El teorema de Nyquist establece que la frecuencia más alta posible que se puede capturar o reproducir es exactamente la mitad de la frecuencia de muestreo. Esto es bastante simple de imaginar, ya que necesitamos las amplitudes para la parte superior e inferior de la forma de onda (que requeriría dos muestras) para conocer con precisión su frecuencia.

Al aumentar la frecuencia de muestreo (arriba) se obtienen muestras adicionales por segundo, mientras que una profundidad de bits más grande (abajo) proporciona más valores posibles para registrar la muestra.

Para el audio, solo nos preocupa lo que podemos escuchar y la gran mayoría de las personas oyen las colas justo antes de 20 kHz. Ahora que conocemos el Teorema de Nyquist, podemos entender por qué 44.1kHz y 48kHz son frecuencias de muestreo comunes, ya que son un poco más del doble de la frecuencia máxima que podemos escuchar. La adopción de estándares de calidad de estudio de 96kHz y 192kHz no tiene nada que ver con la captura de datos de mayor frecuencia, eso no tendría sentido. Pero nos sumergiremos en más de eso en un minuto.


A medida que observamos las amplitudes a lo largo del tiempo, la profundidad de bits simplemente se refiere a la resolución o al número de puntos disponibles para almacenar estos datos de amplitud. Por ejemplo, 8 bits nos ofrece 256 puntos diferentes para redondear, resultados de 16 bits en 65,534 puntos, y el valor de 32 bits de datos nos da 4,294,967,294 puntos de datos. Aunque obviamente, esto aumenta enormemente el tamaño de cualquier archivo.

Puede ser fácil pensar de inmediato en la profundidad de bits en términos de precisión de amplitud, pero los conceptos más importantes para entender aquí son el ruido y la distorsión. Con una resolución muy baja, probablemente perderemos fragmentos de información de menor amplitud o cortaremos la parte superior de las formas de onda, lo que introduce imprecisión y distorsión (errores de cuantificación). Curiosamente, esto a menudo sonará como ruido si reproduce un archivo de baja resolución, porque hemos aumentado efectivamente el tamaño de la señal más pequeña posible que se puede capturar y reproducir. Esto es exactamente lo mismo que agregar una fuente de ruido a nuestra forma de onda. En otras palabras, reducir la profundidad de bits también disminuye el ruido de fondo. También podría ayudar pensar en esto en términos de una muestra binaria, donde el bit menos significativo representa el ruido de fondo.

Por lo tanto, una profundidad de bits más alta nos da un mayor nivel de ruido, pero hay un límite finito a lo práctico que es esto en el mundo real. Desafortunadamente, hay ruido de fondo en todas partes, y no me refiero al autobús que pasa por la calle. Desde los cables hasta los auriculares, los transistores en un amplificador e incluso los oídos dentro de la cabeza, la relación máxima de señal a ruido en el mundo real es de alrededor de 124 dB, lo que equivale a aproximadamente 21 bits de datos.Jerga Buster:

DAC- Un convertidor digital a analógico toma datos de audio digital y los transforma en una señal analógica para enviar a auriculares o altavoces.

Frecuencia de muestreo Medido en hercios (Hz), este es el número de muestras de datos digitales capturadas cada segundo.

SNR- La relación señal / ruido es la diferencia entre la señal deseada y el ruido de fondo del sistema. En un sistema digital, esto está vinculado directamente a la profundidad de bits.

En comparación, la captura de 16 bits ofrece una relación señal / ruido (la diferencia entre la señal y el ruido de fondo) de 96.33dB, mientras que la de 24 bits ofrece 144.49dB, que excede los límites de captura de hardware y percepción humana. Por lo tanto, su DAC de 32 bits solo podrá emitir como máximo 21 bits de datos útiles y los otros bits estarán enmascarados por el ruido del circuito. Sin embargo, en realidad, la mayoría de los equipos de precio moderado superan con un SNR de 100 a 110dB, ya que la mayoría de los otros elementos del circuito introducirán su propio ruido. Claramente entonces, los archivos de 32 bits ya parecen bastante redundantes.

Ahora que conocemos los conceptos básicos del audio digital, pasemos a algunos de los puntos más técnicos.

Escalera al cielo

La mayoría de los problemas relacionados con la comprensión y la concepción errónea del audio están relacionados con la forma en que los recursos educativos y las empresas intentan explicar los beneficios utilizando señales visuales. Probablemente haya visto audio representado como una serie de escalones para líneas de profundidad de bits y de aspecto rectangular para la frecuencia de muestreo. Esto ciertamente no se ve muy bien cuando lo compara con una forma de onda analógica de aspecto suave, por lo que es fácil trotar escaleras de aspecto más fino y "más liso" para representar una forma de onda de salida más precisa.

Aunque podría ser una venta fácil al público, esta analogía común de precisión de "escalera" es una gran dirección errónea y no puede apreciar cómo funciona realmente el audio digital. Ignoralo.

Sin embargo, esta representación visual tergiversa cómo funciona el audio. Aunque puede parecer desordenado, matemáticamente los datos por debajo de la frecuencia de Nyquist, que es la mitad de la frecuencia de muestreo, se han capturado perfectamente y se pueden reproducir perfectamente. Imagine esto, incluso en la frecuencia de Nyquist, que a menudo se puede representar como una onda cuadrada en lugar de una onda sinusoidal suave, tenemos datos precisos para la amplitud en un punto específico en el tiempo, que es todo lo que necesitamos. Los humanos a menudo miramos por error el espacio entre las muestras, pero un sistema digital no funciona de la misma manera.

La profundidad de bits a menudo está vinculada a la precisión, pero realmente define el rendimiento del ruido del sistema. En otras palabras, la señal más pequeña detectable o reproducible.

En lo que respecta a la reproducción, esto puede ser un poco más complicado, debido al concepto fácil de entender de DAC de “retención de orden cero”, que simplemente cambiará entre valores a una frecuencia de muestreo establecida, produciendo un resultado escalonado. En realidad, esto no es una representación justa de cómo funcionan los DAC de audio, pero mientras estamos aquí podemos usar este ejemplo para demostrar que de todos modos no debería preocuparse por esas escaleras.

Un hecho importante a tener en cuenta es que todas las formas de onda se pueden expresar como la suma de múltiples ondas sinusoidales, una frecuencia fundamental y componentes adicionales en múltiplos armónicos. Una onda triangular (o un escalón) consiste en armónicos impares en amplitudes decrecientes. Entonces, si tenemos muchos pasos muy pequeños que ocurren a nuestra frecuencia de muestreo, podemos decir que hay un contenido armónico adicional agregado, pero ocurre al doble de nuestra frecuencia audible (Nyquist) y probablemente algunos armónicos más allá de eso, así que ganamos no podrá escucharlos de todos modos. Además, esto sería bastante simple de filtrar utilizando algunos componentes.

Si separamos las muestras de DAC, podemos ver fácilmente que nuestra señal deseada está perfectamente representada junto con una forma de onda adicional a la frecuencia de muestreo de DAC.

Si esto es cierto, deberíamos poder observar esto con un experimento rápido. Tomemos una salida directamente de un DAC básico de orden cero y también alimentemos la señal a través de un 2 muy simpleDakota del Norte ordene el filtro de paso bajo establecido a la mitad de nuestra frecuencia de muestreo. De hecho, solo he usado una señal de 6 bits aquí, solo para que podamos ver la salida en un osciloscopio. Un archivo de audio de 16 o 24 bits tendría mucho menos ruido en la señal antes y después del filtrado.

Un ejemplo bastante burdo, pero esto demuestra que los datos de audio se recrean perfectamente dentro de esta escalera de aspecto desordenado.

Y como por arte de magia, los escalones desaparecieron casi por completo y la salida se "suavizó", simplemente usando un filtro de paso bajo que no interfiere con nuestra salida de onda sinusoidal. En realidad, todo lo que hemos hecho es filtrar partes de la señal que no habrías escuchado de todos modos. Eso realmente no es un mal resultado para cuatro componentes adicionales que son básicamente libres (dos condensadores y dos resistencias cuestan menos de 5 peniques), pero en realidad hay técnicas más sofisticadas que podemos usar para reducir aún más este ruido. Mejor aún, estos se incluyen como estándar en la mayoría de los DAC de buena calidad.

Como ejemplo más realista, cualquier DAC para usar con audio también contará con un filtro de interpolación, también conocido como muestreo ascendente. La interpolación es simplemente una forma de calcular puntos intermedios entre dos muestras, por lo que su DAC está haciendo mucho de este "suavizado" por sí solo, y mucho más que duplicar o cuadruplicar la frecuencia de muestreo. Mejor aún, no ocupa ningún espacio de archivo adicional.

Los filtros de interpolación que se encuentran comúnmente en cualquier DAC que valga la pena son una solución mucho mejor que transportar archivos con tasas de muestreo más altas.

Los métodos para hacerlo pueden ser bastante complejos, pero esencialmente su DAC está cambiando su valor de salida con mucha más frecuencia de lo que sugeriría la frecuencia de muestreo de su archivo de audio. Esto empuja los armónicos de los escalones inaudibles lejos de la frecuencia de muestreo, lo que permite el uso de filtros más lentos y fáciles de lograr que tienen menos ondulación, por lo tanto, preservan los bits que realmente queremos escuchar.

Si tiene curiosidad acerca de por qué queremos eliminar este contenido que no podemos escuchar, la simple razón es que reproducir estos datos adicionales más abajo en la cadena de señal, por ejemplo en un amplificador, desperdiciaría energía. Además, dependiendo de otros componentes en el sistema, este contenido "ultrasónico" de mayor frecuencia en realidad podría conducir a mayores cantidades de distorsión de intermodulación en componentes de ancho de banda limitado. Por lo tanto, su archivo de 192 kHz probablemente estaría causando más daño que bien, si realmente hubiera contenido ultrasónico dentro de esos archivos.

Si se necesitaran más pruebas, también mostraré una salida de un DAC de alta calidad utilizando el Circus Logic CS4272 (en la foto en la parte superior). El CS4272 presenta una sección de interpolación y un empinado filtro de salida incorporado. Todo lo que estamos haciendo para esta prueba es usar un microcontrolador para alimentar al DAC con dos muestras altas y bajas de 16 bits a 48 kHz, lo que nos da la forma de onda de salida máxima posible a 24 kHz. No se utilizan otros componentes de filtrado, esta salida proviene directamente del DAC.

La señal de salida de 24 kHz (arriba) de este componente DAC de calidad de estudio ciertamente no se parece a la forma de onda rectangular asociada con el material de marketing habitual. La frecuencia de muestreo (Fs) se muestra en la parte inferior del osciloscopio.

Observe cómo la onda sinusoidal de salida (arriba) es exactamente la mitad de la velocidad del reloj de frecuencia (abajo). No hay escalones notables y esta forma de onda de muy alta frecuencia se ve casi como una onda sinusoidal perfecta, no una onda cuadrada de aspecto bloqueado que sugeriría el material de marketing o incluso un vistazo casual a los datos de salida. Esto muestra que incluso con solo dos muestras, la teoría de Nyquist funciona perfectamente en la práctica y podemos recrear una onda sinusoidal pura, ausente de cualquier contenido armónico adicional, sin una gran profundidad de bits o frecuencia de muestreo.

La verdad sobre 32 bits y 192 kHz

Como con la mayoría de las cosas, hay algo de verdad oculto detrás de toda la jerga y el audio de 32 bits y 192 kHz es algo que tiene un uso práctico, pero no en la palma de su mano. Estos atributos digitales en realidad son útiles cuando se encuentra en un entorno de estudio, de ahí las afirmaciones de traer "audio de calidad de estudio a dispositivos móviles", pero estas reglas simplemente no se aplican cuando desea guardar la pista terminada en su bolsillo.

En primer lugar, comencemos con la frecuencia de muestreo. Un beneficio a menudo promocionado del audio de mayor resolución es la retención de datos ultrasónicos que no puede escuchar pero impacta la música. Basura, la mayoría de los instrumentos se caen mucho antes de los límites de frecuencia de nuestra audición, el micrófono utilizado para capturar un desplazamiento de espacio a una velocidad máxima de alrededor de 20 kHz, y sus auriculares que está utilizando ciertamente tampoco se extenderán tanto. Incluso si pudieran, tus oídos simplemente no pueden detectarlo.

La sensibilidad típica de la audición humana alcanza su punto máximo a 3kHz y rápidamente comienza a disminuir después de 16kHz.

Sin embargo, el muestreo de 192 kHz es bastante útil para reducir el ruido (esa palabra clave una vez más) al muestrear datos, permite una construcción más simple de filtros de entrada esenciales y también es importante para el efecto digital de alta velocidad. El sobremuestreo por encima del espectro audible nos permite promediar la señal para bajar el ruido de fondo. Encontrará que la mayoría de los buenos ADC (convertidores analógico a digital) en estos días vienen con sobremuestreo de 64 bits o más.

Cada ADC también necesita eliminar frecuencias por encima de su límite de Nyquist, o terminará con un alias de sonido horrible a medida que las frecuencias más altas se "pliegan" en el espectro audible. Tener una brecha mayor entre nuestra frecuencia de esquina de filtro de 20 kHz y la frecuencia de muestreo máxima se adapta mejor a los filtros del mundo real que simplemente no pueden ser tan empinados y estables como los filtros teóricos requeridos. Esto mismo es cierto al final del DAC, pero como discutimos, la intermodulación puede llevar este ruido de manera muy efectiva a frecuencias más altas para facilitar el filtrado.

Cuanto más inclinado es el filtro, más ondulación hay en la banda de paso. El aumento de la frecuencia de muestreo permite el uso de filtros "más lentos", lo que ayuda a preservar una respuesta de frecuencia plana en la banda de paso audible.

En el dominio digital, se aplican reglas similares para los filtros que a menudo se usan en el proceso de mezcla de estudio. Las frecuencias de muestreo más altas permiten filtros de acción más pronunciados y rápidos que requieren datos adicionales para funcionar correctamente. Nada de esto es necesario cuando se trata de reproducción y DAC, ya que solo estamos interesados ​​en lo que realmente puedes escuchar.

Pasando a 32 bits, cualquiera que alguna vez haya intentado codificar cualquier matemática remotamente compleja comprenderá la importancia de la profundidad de bits, tanto con datos enteros como con coma flotante. Como hemos discutido, cuantos más bits menos ruido, y esto se vuelve más importante cuando comenzamos a dividir o restar señales en el dominio digital debido a errores de redondeo y para evitar errores de recorte al multiplicar o sumar.

La profundidad de bits adicional es importante para preservar la integridad de una señal cuando se realizan operaciones matemáticas, como el software de audio dentro del estudio. Pero podemos descartar estos datos adicionales una vez que finalice la masterización.

Aquí hay un ejemplo, digamos que tomamos una muestra de 4 bits y nuestra muestra actual es 13, que es 1101 en binario. Ahora intente dividir eso entre cuatro y quedaremos con 0011, o simplemente 3. Hemos perdido el 0.25 extra y esto representará un error si intentamos hacer cálculos adicionales o volver nuestra señal a una forma de onda analógica.

Estos errores de redondeo se manifiestan como cantidades muy pequeñas de distorsión o ruido, que pueden acumularse en una gran cantidad de funciones matemáticas. Sin embargo, si ampliamos esta muestra de 4 bits con bits de información adicionales para usar como facción o punto decimal, entonces podemos continuar dividiendo, sumando y multiplicando por mucho más tiempo gracias a los puntos de datos adicionales. Entonces, en el mundo real, muestrear a 16 o 24 bits y luego convertir estos datos a un formato de 32 bits para procesar nuevamente ayuda a ahorrar ruido y distorsión. Como ya hemos dicho, 32 bits son muchísimos puntos de precisión.

Ahora, lo que es igualmente importante reconocer es que no necesitamos este margen adicional cuando volvamos al dominio analógico. Como ya hemos discutido, alrededor de 20 bits de datos (-120dB de ruido) es el máximo absoluto que posiblemente puede detectar, por lo que podemos volver a convertirlo a un tamaño de archivo más razonable sin afectar la calidad del audio, a pesar de que los "audiófilos" son Probablemente lamentando esta pérdida de datos.

Sin embargo, inevitablemente introduciremos algunos errores de redondeo al movernos a una profundidad de bits más baja, por lo que siempre habrá una cantidad muy pequeña de distorsión adicional, ya que estos errores no siempre ocurren al azar. Si bien esto no es un problema con el audio de 24 bits, ya que se extiende mucho más allá del nivel de ruido analógico, una técnica llamada "dithering" resuelve este problema para archivos de 16 bits.

Un ejemplo de comparación de la distorsión introducida por el truncamiento y el tramado.

Esto se hace aleatorizando el bit menos significativo de la muestra de audio, eliminando errores de distorsión pero introduciendo un ruido de fondo aleatorio muy silencioso que se extiende a través de las frecuencias. Aunque la introducción de ruido puede parecer contraria a la intuición, en realidad esto reduce la cantidad de distorsión audible debido a la aleatoriedad. Además, utilizando patrones de interpolación especiales en forma de ruido que abusan de la respuesta de frecuencia del oído humano, el audio difuminado de 16 bits en realidad puede retener un ruido de fondo percibido muy cercano a 120dB, justo en los límites de nuestra percepción.

Los datos de 32 bits y las frecuencias de muestreo de 192 kHz tienen beneficios notables en el estudio, pero las mismas reglas no se aplican para la reproducción.

En pocas palabras, deje que los estudios obstruyan sus discos duros con este contenido de alta resolución, simplemente no necesitamos todos esos datos superfluos cuando se trata de reproducción de alta calidad.

Envolver

Si todavía está conmigo, no interprete este artículo como un rechazo total de los esfuerzos para mejorar los componentes de audio de los teléfonos inteligentes. Aunque la venta de números puede ser inútil, los componentes de mayor calidad y el mejor diseño del circuito siguen siendo un excelente desarrollo en el mercado móvil, solo debemos asegurarnos de que los fabricantes centren su atención en las cosas correctas. El DAC de 32 bits en el LG V10, por ejemplo, suena increíble, pero no necesita preocuparse por los grandes tamaños de archivos de audio para aprovecharlo.

La capacidad de conducir auriculares de baja impedancia, preservar un piso de bajo ruido desde el DAC al conector y ofrecer una distorsión mínima son características mucho más importantes para el audio de los teléfonos inteligentes que la profundidad de bits o la frecuencia de muestreo admitidas teóricamente, y con suerte podremos sumergirse en estos puntos con más detalle en el futuro.

Actualización, 13 de febrero de 2019 (01:31 PM ET): La fuente del ony Xperia XA3 original e muetra a continuación (WinFuture) acaba de publicar un nuevo conjunto de render que repreentan lo ...

Etamo acotumbrado a una actualización regular del hardware Xperia de ony y tampoco e diferente a IFA ete año. Aunque la compañía no ha anunciado un uceor para u Xperia XZ Premium d...

Le Recomendamos