Estructura y percepción del sonido

La audición humana

La audición humana es un proceso en el que participan los dos oídos y el cerebro. Como respuesta a cualquier estímulo acústico, el sistema completo (que en adelante llamaremos simplemente oído) produce la sensación sonora que conocemos. Los humanos tenemos un vocabulario para describir nuestras sensaciones como oyentes: generalmente, hablamos de las propiedades de altura, timbre e intensidad de los sonidos. 

Los especialistas han estudiado la estructura del sistema de audición (ver #######) y son capaces de explicar muchos de los aspectos del proceso. El oído humano comienza con el órgano de ######, que es un receptor sensible al espectro de potencia del sonido incidente. Cada banda de frecuencias estimula un terminal nervioso, y el conjunto de estímulos se procesa en el #####. El análisis cerebral es capaz de separar las diferentes fuentes sonoras, cada una de las cuales contribuye a una zona más o menos ancha del espectro, de la forma que conocemos. Este procesamiento es de una complejidad tal que, hasta ahora, sólo se ha podido automatizar de forma muy limitada.

Tono o altura del sonido

Los sonidos simples y algunos sonidos compuestos nos producen sensación de tono definido. Considera los sonidos de un piano, de una flauta, de una función senoidal, de una onda cuadrada y de un instrumento de percusión. En la figura siguiente tienes un fragmento de la onda de cada uno de ellos, siguiendo el mismo orden:

En los cuatro primeros sonidos las ondas son periódicas, o casi periódicas, y el periodo es el mismo para todas ellas. El oído  percibe en los cuatro casos una misma altura musical, que corresponde a la nota La de 440 Hz. La diferencia percibida entre los cuatro sonidos se llama timbre, y está relacionada con la amplitud de las diversas componentes en la serie de Fourier asociada.

En el sonido de percusión no se aprecia una frecuencia clara a la vista, y su sonido no da una sensación de tono definido.

####### SOLDAR

Tono y espectros

El oído analiza los espectros de los sonidos recibidos. En el caso de los sonidos simples, como la potencia está concentrada en una frecuencia dada, la sensación de tono está asociada a ella. Los sonidos compuestos nos producirán una sensación más o menos acusada de tono según se ditribuya la potencia sonora en su espectro. Si el espectro de un sonido compuesto ofrece máximos cuya frecuencia es múltiplo de una frecuencia f0 dada, como el de la figura siguiente, el oído le asigna la altura tonal de una onda senoidal de esta frecuencia. 


#### Espectros

Observa en este video (mwv, mpeg o mov) una secuencia de espectros de cuatro sonidos sintéticos. Nota que los espectros tienen un eje de abcisas logarítmico.  Ten en cuenta las propiedades de las ondas en diente de sierra: Una onda en diente de sierra de una frecuencia f0 se descompone en una suma de ondas senoidales de frecuencias n·f0.

  1. Una onda senoidal de 440 Hz con toda su potencia concentrada en f0 = 440 Hz.

  2. Una onda de sierra de 440 Hz con su potencia distribuída entre f0 = 440 Hz, 2·f0 = 880 Hz, 3·f0 = 1320 Hz, etc. Observa que el tono coincide con el sonido 1, pero el timbre cambia.

  3. La onda 2 filtrada para eliminar la frecuencia f0, pero conservando la potencia original en 2·f0, 3·f0, etc. El resultado suena distinto: el volumen global ha bajado, porque el filtro le ha quitado toda la energía alrededor de  f0, y suena más agudo, porque la potencia se ha desplazado hacia la parte superior del espectro. Su espectro tiene este aspecto

    No obstante, el tono percibido es el mismo que en los dos sonidos anteriores, a pesar de que no hay potencia f0. El oído busca el máximo  común divisor de las frecuencias percibidas y, si lo encuentra, lo utiliza como tono, aunque no aparezca potencia en el espectro.

  4. Una onda de sierra de 880 Hz. Como ya no aparecen las frecuencias 1320, 2200 y demás múltiplos impares de 440 Hz, el oído asigna la altura a f0 = 880 Hz.

Has de entender que, a pesar de sus diferencias tímbricas, los tres primeros sonidos tienen la misma altura tonal, y el cuarto sonido está una octava por encima de los anteriores. Si no lo oyes claro, prueba a cantar las notas mientras escuchas el video.

Esta manera de percibir el tono tiene grandes consecuencias en nuestra vida sonora cotidiana. La percepción de la altura tonal, por ejemplo, es importante para comprender el habla de los demás y, por supuesto, para reconocer melodías. A menudo utilizamos dispositivos de comunicación o reproducción que realizan filtrados enérgicos del sonido: el teléfono, los receptores de radio de bolsillo y otros sólo transmiten sonido en una banda muy estrecha del espectro. No obstante, seguimos percibiendo las alturas tonales aunque correspondan a las frecuencias eliminadas, y esto hace posible el reconocimiento del habla y de la música.

Una cuerda vibrante (de violín, piano, guitarra, etc)

Un timbal

Un martillazo

Timbre

Margen dinámico

El oído humano es un sentido con una sensibilidad notable. La relación de potencia entre la mínima onda de presión perceptible y máxima onda soportable supera los 100 dB. Los desplazamientos del tímpano para la onda más leve perceptible están por debajo de los 10–8 m. En muchos ámbitos, se utiliza una escala de 120 dB, en la que el nivel 0 dB corresponde a 10–5 Pascal/m2.

Sonoridad

La sonoridad (loudness en inglés) es la potencia sonora percibida por un ser humano. Informalmente, también se le llama  volumen o intensidad. La sonoridad no sólo depende de la potencia absoluta del sonido tal como se mide físicamente, porque el oído no es lineal: el "volumen" percibido al escuchar dos sonidos simples de la misma potencia pero de frecuencias distintas no siempre es el mismo.
Para medir la sonoridad se utiliza la unidad fon (phon en inglés). Un sonido tiene una sonoridad de n fones si el oyente tipo lo percibe igual de fuerte que un sonido simple de 1000 Hz de n dB de potencia.
Desde 1930, los investigadores han construído curvas isofónicas (o equal-loudness contours) de forma experimental. En estas curvas, las abcisas representan frecuencias y las ordenadas representan potencias sonoras medibles (en cualquiera de las unidades apropiadas). La curva recorre el conjunto de sonidos simples cuya potencia percibida es la misma para el oyente. Puesto que, por definición, potencia y sonoridad coinciden a 1 kHz, la curva isofónica que pasa por la potencia de n dB a 1 kHz recogerá todos los sonidos de n fones. A grandes rasgos, la curva isofónica para una sonoridad dada tiene este aspecto:

 

Una curva isofónica se puede entender como un gráfico de sensibilidad auditiva invertido: los puntos más bajos de la curva señalan aquellas frecuencias para las que el oído humano es más sensible, puesto que requieren menor potencia para crear la misma sensación. Igualmente, cuanto más sube la curva hace falta más potencia para mantener la sensación: el oído es menos sensible para esas frecuencias. La gama de curvas isofónicas para sonoridades de 0 a 100 fones (en intervalos de 10 fones) describen gráficamente la transformación de las ondas de presión en sensaciones que realiza el oído (Mira en ####). Esta descripción se aplica en diversos campos: electrónica de audio, aislamiento de recintos, arquitectura de auditorios, normativas de salud pública, etc. y está recogida como norma industrial ISO. Mira en ###########

La forma de las curvas isofónicas está justificada por la estructura interna del oido. Se puede modelar el oído humano como un pabellón y que recibe el sonido, seguido de un filtro y de un receptor final. La curva de respuesta del filtro viene definida por la estructura del oído y la geometría de las diversas cavidades. Mira en ###########

Las curvas isofónicas dependen de cada persona y evolucionan con la edad; pero ciertos rasgos se repiten en todos los casos no patológicos:

Oyentes tipo A, B, C y D

El sonido en el espacio. Estereofonía

El proceso total de escucha combina Con su par de oídos, un ser humano puede deducir la dirección de cada fuente de sonido. El cerebro utiliza las diferencias de intensidad sonora percibida entre ellos y los retardos (menores que 1 ms) para asignar a cada fuente una orientación en el espacio.

Bandas críticas