Audio/MIDI Music Photos 3D  Vende tus canciones   Vende tus fotos   Vende tus gráficos 

M U S I C A   C O N
COMPUTADORAS
E N   E S P A Ñ O L
iTunes Amazon

Profundidad de bits y Frecuencia de Muestreo

Por Sergio Patiño | Versión Imprimible Versión Imprimible | Tutoriales >> Masterización

¿Por qué no más de 24 bits ni 48 KHz?

Si tuvieras un automóvil VW sedan y nos dijeran que alcanza 250 Km por hora ¿lo manejarías a esa velocidad? Existen un millón de argumentos para no hacerlo pero todo se resume a una sencilla razón y es que no está equipado para desarrollar esa velocidad, lo mismo ocurre con nuestras interfaces o placas de sonido que nos ofrecen 32 bits y 192 KHz pues no están equipadas para manejar estas altísimas resoluciones. Para explicar esto voy a dividir el tema en dos grandes puntos: profundidad de bits ( bit depth o wordlength ) y frecuencia de muestreo ( sample rate ).

Lo primero que debemos considerar es que nuestras placas de sonido o interfaces son en realidad convertidores analógico/digital/analógico y en términos simples lo que hacen es convertir el sonido a datos ( bytes ) para poderlos procesar en nuestras computadoras y después los regresan de datos a sonido para que los podamos escuchar.

Al sonido, como a cualquier otra cosa, para representarlo en términos digitales se le debe asignar un tamaño de muestra ( bits, cada 8 de estos conforman un byte ) y un número de muestras por segundo ( Hertz ).

 

Profundidad de Bits

Lo que la profundidad de bits nos dice es: de qué tamaño será cada una de las muestras, entre mayor sea el tamaño de muestra mayor cantidad de información podremos tener de cada una y lógicamente nuestros archivos también serán más grandes. Las diferentes profundidades que encontramos en audio son: 8, 16, 20, 24, 32 y 64 bits.

Si tenemos 24 bits para cada muestra ¿qué pasará al llegar al bit número 25? Cuando rebasamos el número de espacios asignados para definir nuestra muestra (wordlength) significa que ya no hay manera de interpretar datos para generar sonido y lo que obtenemos es lo que se conoce como ‘cama de ruido' a este fenómeno en el que se crea ruido por ‘indefinición', porque ya no tenemos manera de expresar algo más allá del número de bits asignado y se le llama ‘truncado de muestra'. En términos prácticos esto es el ‘Hiss' y es equivalente al ruido que encontramos en una cinta analógica, la diferencia es que en un entorno analógico el ruido es producido por la fricción entre la cinta y la cabeza lectora mientras que en el entorno digital el ruido es producto del ya mencionado truncado de muestra o wordlength truncation . Y entre más bits de wordlength tengamos la cama de ruido estará más abajo en volumen. De esto también se desprende el que entre más bits haya en el wordlength la información adicional que podemos captar corresponderá a la parte más tenue del sonido. A este fenómeno se le conoce como ‘rango señal a ruido' o signal to noise ratio

 

El volumen lo expresamos en deciBeles (dB) y contrario a lo que pudieramos pensar esta medida no corresponde a volumen sino a presión (fuerza sobre una superficie), en el caso particular del sonido nos referimos a la presión del aire sobre nuestros oídos y se abrevian dBSPL (en inglés deciBels Sound Pressure Level ) y sus valores van de 0 hacia (infinito). A su vez los aparatos de audio tienen su propia manera de ‘medir' el volumen y lo hacen a partir de 0 como valor máximo hacia - o donde empiece la cama de ruido del sistema y siempre en números negativos, esto representa el voltaje necesario para producir un cierto volumen o mejor dicho una cierta potencia; estos valores corresponden a los deciBeles de escala completa o dBFS ( deciBels Full Scale ). Dentro de nuestro tema los dBFS son lo que nos interesan pues así podemos calcular la cama de ruido para cada profundidad de bits así como algunas aproximaciones para entornos analógicos. En sistemas analógicos la cama de ruido es variable y en el entorno digital la cama de ruido es exacta. Así obtenemos la siguiente tabla:

Debemos tener en cuenta que estos son valores teóricos, debido a muchísimos factores en la práctica en un convertidor profesional de mínimo 5,000 dls. el valor más bajo está alrededor de -127 dBFS para 24 bits. Como podemos ver el término ‘profundidad de bits' es debido a que los dBs van hacia abajo.

Hasta ahora entre más profundidad de bits mejor pero las cosas se complican cuando tenemos que llevar nuestras grabaciones o masterizaciones a un medio de menor resolución, como lo dice la tabla si establecemos una profundidad de 24 bits o grabamos en un DAT y su destino es un CD entonces al terminar debemos ‘bajar' el sonido resultante a 16 bits el problema que esto representa se ilustra en el siguiente ejemplo:

Si dividimos el número 23 entre 7 el cociente será 3.28, ahora, digamos que solo tenemos dos dígitos para expresar este cociente. La manera más sencilla sería truncar el número a 3.2 pero nos quedaríamos lejos del valor real, lo correcto sería redondear la cantidad y así obtenemos 3.3 que está mucho más cerca del cociente en cuestión.

Supongamos ahora que los tres dígitos de 3.28 corresponden a un wordlength de 24 bits y los dos dígitos corresponden a un wordlength de 16 bits, al truncar el número a 3.2 nos estamos perdiendo una parte de la información y necesitaremos redondearla para obtener una mejor aproximación, regresando a nuestro tema, en el audio lo que se utiliza para ‘redondear' la información es conocido como dither que mediante la introducción de una señal aleatoria (ruido) hace un promedio con la información ‘enterrada' en el ruido del truncado y ‘rescata' parte de esa información, luego, para terminar de ‘redondear' se utiliza el noiseshaping el cual introduce a la señal un ruido controlado y difícil de escuchar para el oído humano para ‘enmascarar' el ruido restante del truncado.

Cada vez que tenemos que bajar de profundidad de bits ( downsampling ) debemos realizar este proceso pero como todo en este mundo lo bueno cuesta y aunque tengamos 24, 32 o incluso 64 bits como nos lo ofrecen los fabricantes debemos contar con un muy buen dither y noiseshaping que además de su elevado costo debemos tomar en cuenta que los detalles que nos ofrecen las resoluciones de 24 y 32 bits se encuentran, como ya dijimos, en la parte más tenue del sonido a la que no somos muy sensibles.

Si por el contrario tenemos el número del ejemplo, 3.3 (16 bits) y lo queremos regresar a los 3 dígitos (24 bits) no sabemos si provino de un 3.32 o de un 3.29 por lo que lo único que podemos hacer es agregarle ceros, 3.30 los cuales no tienen ningún significado en cuanto a información hasta que a ese 3.30 se le aplique algún proceso en el que se ‘llenen' esos ceros y al regresar a 16 bits necesitaremos usar de nuevo el dither por lo que así como su explicación se convierte en un ir y venir de ruido.

En conclusión, si no tienes un estudio profesional grabar o masterizar en 24 bits sin un buen dither y noiseshaping quedará igual o peor que hacerlo directamente en 16. En los estudios grandes se procesa el sonido en 24, 32 y 64 bits punto flotante y utilizan incluso módulos específicos de dithering y NS pero para un estudio casero sin el monitoreo y acústica apropiados no vale la pena gastar en placas que nos ofrecen tal profundidad.

 

Frecuencia de Resolución

Este es el otro componente crucial del dominio digital pero ¿qué significa 44.1, 48, 96 y 192 KHz? En términos sencillos esto quiere decir cuántas muestras se podrán analizar por segundo, si tenemos una profundidad de 24 bits a 48 KHz (que es la resolución de un DAT) significa que podremos procesar 48000 muestras por segundo de 24 bits cada una, entre mayor sea la frecuencia de muestreo mayor número de muestras tendremos y por consiguiente podremos analizar a mayor detalle.

Hasta ahora como en el caso de la profundidad de bits entre mayor resolución tengamos mejor pero en nuestro caso no es así y es aquí donde vamos a resolver el mito de las altísimas frecuencias de muestreo que no nos dan un beneficio y sin embargo entre mayor resolución mayor costo para nosotros.

La primera razón es la limitación de la frecuencia más alta para analizar:

Cómo sabemos el sonido también posee frecuencias y por supuesto esta también se mide en Hertz (Hz). La frecuencia se define en términos sencillos como el número de ciclos completos por segundo que ocurren (un periodo positivo y uno negativo), veamos la siguiente figura.

La línea horizontal del medio representa tiempo, en este caso fracciones de segundo, los rectángulos representan una muestra de una resolución de supongamos 48 KHz, dentro de cada cuadro encontramos la fase positiva de una onda y en el siguiente la fase negativa de la misma onda, ahora haciendo aritmética sencilla podemos notar que necesitamos dos muestras (rectángulos) para analizar la onda completa (fase positiva y negativa) por tanto podemos concluir que la frecuencia más alta que podemos analizar en un muestreo de 48 KHz es 24 KHz esto debido a que separar una onda es sus componentes positivo y negativo es el tamaño más grande que podemos analizar; así obtenemos las siguiente imagen:

 

Si tuvieramos una frecuencia de 48 KHz para analizar en una frecuencia de muestreo de igualmente 48 KHz obtendríamos algo así:

 

A todo esto debemos agregar que el oído humano promedio solo es sensible en un rango comprendido entre 22 Hz y 16 KHz mientras que un oído entrenado logra escuchar entre 20 Hz y 20 KHz por lo que aún la resolución de un CD (44.1 KHz) quedará muy por encima de la frecuencia más alta que podemos oír, es decir puede analizar hasta 22.05 KHz. Con esto podemos asumir que el beneficio se obtiene para frecuencias más bajas pues las puede dividir en ‘rodajas' más pequeñas, el problema viene al momento de hacer la conversión analógico-digital-analógico.

 

El sonido que producimos con nuestros instrumentos se transmite en forma de vibraciones (Movimiento Armónico Simple) y lo podemos traducir a impulsos eléctricos y magnéticos, esto es lo que corresponde al dominio analógico, en otras palabras es una especie de ‘fotografía' electromagnética del sonido que escuchamos. Nuestras placas de sonido o interfaces se encargan de traducir dichos impulsos en datos (1's y 0's). Es al momento de hacer esta conversión analógico a digital ( A/D ) donde se presentan los problemas en resoluciones altas con equipo de bajo costo pues al entrar el sonido se realiza lo que se comoce como Noise Reduction y que consiste en elevar a una frecuencia mucho más alta de la que se va a trabajar, tomar el ruido y ‘subirlo' fuera del rango audible del ser humano una vez hecho esto el sonido se regresa a la frecuencia de resolución establecida. En este tipo de convertidores ADC ( Analog-Digital-Converter ) baratos los filtros establecidos para esta reducción de ruido introducen un sonido ‘cajoso' similar al de los reproductores de CD baratos lo malo es que no podemos notar este sonido al momento de grabar y mezclar debido a que queda enmascarado por efecto del jitter (estos conceptos se explicarán posteriormente) que es un fenómeno pasajero y no se queda en nuestra grabación, sin embargo el sonido ‘cajoso' sí queda grabado y se traduce en un sonido chico y apagado. El aliasing también producto de un mal filtrado interviene y consiste en que una alta frecuencia introduce ‘fantasmas' en el rango de fracciones de su valor o viceversa, estos fantasmas son puntos en la frecuencia de muestreo que pueden corresponder a cualquiera de las dos frecuencias, la original o su fracción y al momento de hacer la conversión D/A el convertidor no sabe de quién vino esta señal.

En este ejemplo la frecuencia alta (en color rojo) tiene los mismos puntos de muestreo que una frecuencia baja (en color azul). Supongamos que la frecuencia alta vale 48 KHz (que sería la más alta en un SR de 96 KHz) dado que por cada ciclo completo en azul caben 10 ciclos completos en rojo tenemos que su valor es de un décimo de esta, es decir 4.8 KHz que ya está dentro de nuestro rango audible, con un filtrado deficiente (que es justo lo que ocurre con placas de tan altas resoluciones y bajos costos) el DAC no sabe a quién corresponde esa información y cada vez que opte por los 4.8 KHz vamos a oír cosas (fantasmas) que no estaban ahí en un principio.

 

Por último tenemos el PLL ( Phase-Lock Loop ) que es el encargado de mover la información dentro del convertidor bit por bit es decir, mueve los 0's y 1's uno a la vez y debe hacerlo a una velocidad altísima para que no lo notemos, este chip está controlado por un cristal de cuarzo que debe ser extremadamente preciso y debe estar sincronizado con el reloj que va a controlar la frecuencia de muestreo, si el PLL no es de buena calidad vamos a tener un sonido muy malo en la conversión D/A pero no afectará la información dentro de la computadora, es decir, no va a distorsionar el sonido, por el contrario un mal PLL al momento de hacer la conversión de entrada (A/D) va a afectar el sonido de manera permanente e irreversible.

En conclusión, el problema no es la alta resolución en sí sino la mala calidad de los componentes del convertidor pues entre mayor resolución tengamos en una placa o interfaz de bajo costo mayor será el número de ‘artefactos' que introducirán al sonido. Para darnos una idea una placa de sonido de 10 x 10 I/O que conocemos cuesta entre 400 y 1000 dls. mientras que un convertidor A/D de 8 entradas de la más alta calidad lo podemos comprar por la módica cantidad de 8,500 dls. sin mencionar que nos hará falta un convertidor D/A del mismo precio, además necesitaríamos una interfaz para que ese sonido digitalizado entre a nuestra estación de trabajo.

He ahí las razones de por qué no deberíamos pasar de una resolución de 48 KHz y de una profundidad de 24 bits porque esas altísimas resoluciones nos son más que mercadotecnia pues realmente nos entregan lo que dicen pero a costa de un gran daño a nuestro sonido.

 

Sergio Patiño (noisemastering)
Director General
Noise Mastering Studio®
www.noisemastering.com



  
  

[ Volver Masterización | Índice de categorías de tutoriales ]

YIO feat. Leah
The dance of Mahanaim

The dance of Mahanaim - Sergio Schnitzler aka YIO ft Lea Rossetti - Music Video by YIO multimedia
Vaisnava feat. Leah
As you are (video by Yio)

As You Are - Forrest Gore aka Vaisnava ft Lea Rossetti - Music Video by YIO multimedia
Yio
The Bond

The Bond - Sergio Schnitzler aka YIO -Vocal Trance- Music Video by YIO multimedia
Yio
Over Here

Over Here - Sergio Schnitzler aka YIO -Vocal Trance- Music Video by YIO multimedia
Yio
Anhedonia

Anhedonia - Sergio Schnitzler aka YIO -Breakbeat- Music Video by YIO multimedia