Acústica Musical | Serie de Artículos de Divulgación

Esta serie de artículos de divulgación acústica los hice a partir de clases que desarrollé y enseñé como Ayudante de Cátedra hace ya algunos años en la Comisión de Trabajos Prácticos de la Cátedra de Acústica Musical de la Facultad de Bellas Artes de la Universidad Nacional de La Plata. (U.N.L.P) con Prof. Gustavo Basso como titular. Siguiendo el diagrama de los teóricos dado por su titular, la bibliografía de la que se nutre estos artículos es la utilizada por entonces en la cátedra, más material de búsqueda propia aportado para tal fin. El desarrollo del texto es de un servidor, espero les sirva.  


Audio digital
por Maximiliano Salomoni

Las nuevas tecnologías se han incorporado absolutamente a los procesos creativos del arte, ya sea como herramientas, como medio o como fin mismo. En imagen o sonido, todo se produce, se transmite o se almacena en algún momento en base dos.

Propongo aquí una breve explicación sobre el sistema binario primero. Quizás esto parezca un poco matemática abstracta para el arte musical, pero entiendo que el sistema digital es el lenguaje de las herramientas actuales de producción artística.

El audio digital es la codificación en el sistema binario de una señal eléctrica que representa una onda sonora. La secuencia de números binarios que representan a la onda se obtiene del muestreo y cuantificación digital de la señal eléctrica. Una vez convertida la señal analógica a digital, se puede codificar, comprimir, almacenar y reproducir.

Comenzaremos por lo básico y fundamental… ¿qué es el famoso sistema binario? Pero antes convendría refrescar los conocimientos que tenemos, quizás un poco olvidados, sobre el sistema decimal, el sistema que usamos a diario.  

 

El sistema decimal

O también llamado sistema en base diez, tiene algunas características básicas:

 •Sistema decimal: Significa que este sistema usa diez símbolos: 0-1-2-3-4-5-6-7-8-9.

 •Es un sistema posicional: Es decir que cada símbolo tiene un valor relativo que depende del lugar que ocupa con respecto a los otros números.

Por ejemplo el número 365:

                                                              5 Unidad

                                                            60 Decena

                                                           300 Centena                        

                                                           365

El 5 esta en posición de las unidades. El 6 en la posición de las decenas y por tanto significa 60 unidades. El 3 esta en la posición de las centenas y significa 3 centenas (es decir 30 decenas o 300 unidades).

                            Sumando 300+60+5= 365

No todos los sistemas numéricos son posicionales, por ejemplo, el sistema de numeración romano.

 

El sistema de numeración decimal se llama así debido a que agrupa los elementos de 10 en 10, por ejemplo:

 

El número 22 que representa la cantidad de círculos de la figura superior, se debe a que los elementos se agrupan de la siguiente manera:
2 grupos de 10 elementos (2 decenas)= 2
2 elementos sueltos                             = 2
22 en base diez                                    = 22 (10)

Sistema binario de numeración

El sistema binario usa solo dos símbolos 0 y 1. Y los elementos se agrupan de dos en dos:

 

Se forma un grupo cada dos unidades

7 grupos de 2

1 unidad

 Ahora, si se agrupa cada dos grupos de dos unidades, me quedará un grupo de 4 unidades:

3 grupos de 4

1 grupo de 2

1 unidad

 Cada dos grupos de cuatro unidades formo un grupo de 8 elementos me dará:

 

1 grupo de 8

1 grupo de 4

1 grupo de 2

1 unidad

 Así el número 15 escrito en base 2 es = 1111 y se obtuvo realizando sucesivas divisiones:

  


I. Codificación de la señal

Como vimos antes, una señal digital es una representación en código binario de una señal acústica. Pudiendo realizarse diversos procesos sobre esta para luego poder almacenarla en la memoria de un dispositivo digital.

Al utilizarse el sistema binario, la señal codificada solo tiene dos valores posibles: 0 y 1. Cada dígito binario se denomina bit (BITS proviene de BInary digITS). Para reconstruir una señal el mecanismo decodificador solo tiene que ser capaz de reconocer la diferencia entre dos valores, por lo tanto existe menos margen de error que si se usara, por ejemplo el sistema decimal.

Un número binario compuesto por múltiples dígitos suele denominarse “palabra” y al número de bits se lo denomina “longitud de palabra”. Al bit de la derecha se lo denomina “bit menos significativo” y al bit del extremo izquierdo “bit más significativo”.

Ej: 10100111

Una palabra de 8 bits se la denomina Byte: La capacidad de las memorias y de los sistemas digitales de almacenamiento se mide en bytes, pero para evitar números muy extensos, se utilizan múltiplos. Pero tengamos en cuenta que en computación, cuando se habla de memoria, un Kilobyte no significa que Kilo equivale a 1000 como en el sistema de numeración decimal, sino 1024. Veamos porque…

Recordemos algunos prefijos para potencia 10 en la nomenclatura estándar (decimal)

Kilo =  1.000 (10³)

Mega = 1. 000.000 (106)

Giga = 1.000.000.000 (109)

En cambio en el sistema binario, un kilo es equivalente a 210 Por consiguiente:

Kilobytes = 2 10 bits = 1024 bits

Este valor se usa porque los diseños de memoria normal poseen un valor exacto a la potencia de 2. Dado que la memoria esta compuesta en sí misma por números binarios, la longitud de la palabra limita el valor de la memoria. Este valor se calcula elevando dos a la potencia de la longitud de la palabra. Así una palabra de 4 bits tiene 16 combinaciones diferentes (2 4 =16)

Por lo tanto una memoria de

Un Kilobyte contiene 1024 bytes

Un Megabyte contiene 1024 Kilobytes

Un Gigabyte contiene 1024 Megabytes

 

II. Muestreo

La digitalización de una señal acústica, consiste en la transformación de una señal analógica en una secuencia numérica. El procedimiento más usual, es el llamado Pulse Code Modulation (PCM), que consiste en reemplazar una señal eléctrica por una secuencia de bits que representan su forma de onda.

 

En la modulación por  codificación de pulsos (PCM) la forma de onda analógica se mide periódicamente a la frecuencia de muestreo. La tensión de cada muestra es descrita mediante números enteros, los cuales son almacenados y/o transmitidos.

 Encontramos un buen ejemplo de esta clase de conversión, en el movimiento de ida y vuelta que realiza el diafragma de un micrófono al ser excitado por una onda acústica. El desplazamiento del diafragma es transformado en una señal eléctrica por el micrófono, y esta señal será la que ingrese al conversor AD de una placa de sonido (por ejemplo de una computadora).

Para transformar la señal analógica proveniente del micrófono en una señal digital, primero se debe discretizar el TIEMPO continuo de la señal,  este proceso se denomina  MUESTREO (o SAMPLING).  Luego se debe discretizar también el VALOR DE PRESIÓN de la señal, proceso que se conoce como CUANTIZACIÓN. Y por último, la CODIFICACIÓN del resultado de la cuantificación en código binario. La conversión de una señal analógica a otra digital se realiza por medio de un dispositivo especial llamado Conversor Analógico- Digital (ADC). En esta segunda entrega veremos cómo es el proceso de muestreo. 

Entonces, la conversión de la señal analógica a digital comienza en el proceso de muestreo. Este proceso consiste en convertir señales eléctricas continuas (señales analógicas) en una serie de muestras definidas sólo en ciertos instantes (señal digital). Como vimos en la edición anterior, una señal digital es la codificación en sistema binario de una señal eléctrica que representa una onda sonora (es decir, analógica).

 

FRECUENCIA DE MUESTEREO

Supongamos que se muestrea una señal sinusoidal. Un conversor analógico-digital toma muestras a intervalos de tiempo espaciados regularmente. Una buena analogía para entender esto es: El cine. Como sabemos la imagen en movimiento de una película no es otra cosa que una sucesión muy rápida de fotografías, que el ojo humano percibe como un continuo. Cada fotografía de una película sería las muestras de la onda analógica, que se toman para construir una señal digital. Así, la señal digital queda definida únicamente por ciertos valores temporales  discretos, pero el oído lo percibe como un continuo, ya que la frecuencia de muestreo es alta.  Por ejemplo en los CDs las muestras ocurren a una tasa de 44,100 veces por segundo, (en este caso se dice que la frecuencia de muestreo es de 44.100Hz).

Entonces, la frecuencia de muestreo indica cuantos valores de amplitud se toman por segundo. Los valores temporales discretos de la señal digital quedan determinados por la relación entre la cantidad de muestras y la unidad de tiempo (44.100 en UN SEGUNDO). Una frecuencia de muestreo de 22.500 Hz indica que se toman 22.500 muestras por segundo.   

La relación entre la frecuencia de la señal a muestrear y la frecuencia de muestreo es de gran importancia. Si la frecuencia de muestreo es alta comparada con la frecuencia de una señal, no hay problema alguno, ya que hay muchas muestras disponibles para representar cada ciclo (período) de la onda. Cuantas más muestras se toman en una unidad de tiempo mejor se representa la onda. Por ejemplo, si muestreamos una onda sinusoidal de 330Hz a una frecuencia de muestreo de 3000 hz.

Pero, ¿qué ocurre si muestreamos la señal anterior de 330hz a una frecuencia de muestreo menor, digamos 300hz?

El resultado se ve en la figura que sigue: la sinusoide original completa el ciclo más rapidamente que lo que dura un ciclo completo entre sucesivas nuestras. Si tomamos en cuenta sólo los puntos, podemos pensar que se trata de una sinusoide de mucho menor frecuencia:

 

  En este gráfico se pueden ver 30 ciclos completos de una sinusoide de 330Hz

 

FRECUENCIA DE NYQUIST

Solamente las frecuencias por debajo de la mitad del índice de muestreo serán exactamente representadas. Este límite definido por la mitad de la frecuencia de muestreo, es llamada Frecuencia de Nyquist, debido al ingeniero Harry Nyquist, quien estableció el siguiente teorema.      

“Para representar digitalmente una señal que contiene componentes de frecuencia hasta x Hz, es necesario usar una frecuencia de muestreo  de, al menos, 2x muestras por segundo".

Es decir, si se desea muestrear una señal que tiene componentes de hasta 20.000Hz, hay que usar como mínimo una frecuencia de muestreo de 40.000Hz. Como una sinusoide describe un movimiento de ida y vuelta, para representarla esquemáticamente se necesita un valor para la “ida” y otro para la ”vuelta”: La señal digital, deberá contener al menos, dos números por cada ciclo de la entrada analógica.

En resumen, cuando la frecuencia de entrada (la señal analógica) es igual o inferior a la frecuencia de muestreo, la onda será correctamente muestreada. Si es superior, se reconstruye una forma de onda diferente de la original.       

 En el gráfico anterior se ve en (a) un muestreo adecuado, mientras que en (b) se ve un muestreo mal realizado, puede verse como se produce el efecto llamado aliasing, en el que aparece una frecuencia (marcada con líneas de puntos) que no corresponde a la señal original. Entre los muchos efectos negativos del aliasing se encuentra la distorsión de la amplitud de los componentes de la señal, que se percibe como un ruido agregado muy difícil de eliminar una vez realizado el muestreo.


III. Cuantización

Cuantizar significa asignarle valores discretos, a cada muestra de la presión sonora de una señal. Por lo tanto, el fin de la cuantización será determinar dentro de qué rango de amplitud disponible (regiones) caerá el valor de cada muestra. Vimos que el procedimiento PCM consiste en reemplazar una señal, por una secuencia de bits que representan su forma de onda. Por lo que, los valores de amplitud de una señal serán representados con N bIts. Usualmente los conversores generan 16, 21 o 24 bits por muestra.

En el gráfico 1, se aprecia la cuantización de una parte de una señal sinusoidal. La diferencia entre el valor de cada muestra (puntos en la figura) y el valor de la onda se denomina error de cuatización, y determina en gran medida la calidad del proceso de digitalización.

Gráfico 1

Las muestras se convierten en valores de tensión en un rango total de E volts. Se le asignan ciertos rangos (regiones) de valor disponible para cada muestra y, según la amplitud de la onda original, ésta caerá dentro de una u otra región. Como se ve en el gráfico 2, el cuantizador le asigna a cualquier valor de la amplitud de la señal que este dentro de una región un número binario que se asocia con esa región (a todas las tensiones dentro del mismo intervalo de cuantización se les asigna el mismo número). Este método es el más común y se lo denomina cuantización lineal. 

Gráfico 2

 Un sistema de grabación como por ejemplo, un reproductor de CDs o un sampler tiene uan resolución de 16, 20 o 24 bits. Este dato se refiere al rango dinámico del sistema. Un sistema de 1 bit permite la codificación de las amplitudes en dos niveles (2¹= 2) los correspondientes al 0 y al 1. Uns sistema de dos bits en cuatro niveles (2²= 4). Uno de 3 bits en 8 niveles (2³= 8) y uno de 4 bits en 16 niveles (2⁴ = 16) Un sistema de 16 bits, típico de los CD, permitirá la existencia total de 65.536 niveles (2¹⁶ = 65.536).

El error de cuantización, la diferencia entre la aproximación de la señal  y el valor real de la señal antes de ser convertida, se oye como ruido (en realidad es una distorsión) que se agrega a la señal durante el  proceso de digitalización. La relación entre la amplitud de la señal y la amplitud de este error de cuantización se denomina Relación señal-ruido de cuantización, representa el grado de precisión en la codificación de la señal. Está directamente relacionada con la resolución del sistema, y se puede calcular de:  

Relación señal-ruido de cuantización (en dB) = 6 x N (Bits) + 1,8 dB

El número 6, se debe a que por cada bit agregado se aumenta en 6 dB la relación S/R. En un sistema de 16 bits se tiene una relación señal-ruido de 97,8 db (es decir un rango dinámico de aproximadamente 98 dB).

A mayor frecuencia de muestreo y a mayor resolución en bits, aumenta la respuesta en frecuencia y el rango dinámico de una señaldigitalizada. Este aumento de calidad, sin embargo, no es gratuito: aumenta el tiempo de procesamiento y la cantidad de memoria requerida para almacenar la información.

Por ejemplo, la cantidad de memoria que se requiere para almacenar un minuto de sonido en stereo a N=16 bits y a una frecuencia de muestreode 44.100Hz es:

 

Cada muestra posee 16 bites = 2 bytes

Hay dos canales estereofónicos. Entonces lo multiplicamos por 2 = 4 bytes

Hay 44.100 muestras por segundo = 4 x 44.100 bytes/seg = 176.400 bytes /seg

En un minuto = 60 seg/min x 176.400 bytes/seg =10.584.000 bytes/min

Reducción a Mb (se divide 1024²) = 10,09Mb/min.

Es decir, un minuto de señal a 44,1 Khz y 16 bits ocupa 10 Mb  de memoria.

 A partir de este valor es sencillo entender la aparición de diversos sistemas de compresión de señales de audio como por ejemplo MP3.

 

De esta forma terminamos de ver de modo sencillo, el proceso de digitalización de una señal acústica. A través de éste proceso la señal analógica se transforma en una señal digital.

 


No hay comentarios:

Publicar un comentario

Sección >> Historia General

  Historia | Cine | Educación > > La Ciénaga (2001 Martel): Análisis del Film como Fuente de Época e  Interpretación de la Metáfora de...