Procesamiento de señales de audio

De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a buscar

El procesamiento de señales de audio es un subcampo del procesamiento de señales relacionado con la manipulación electrónica de señales de audio . Las señales de audio son representaciones electrónicas de ondas de sonido , ondas longitudinales que viajan a través del aire y consisten en compresiones y rarefacciones. La energía contenida en las señales de audio normalmente se mide en decibelios . Como las señales de audio pueden representarse en formato digital o analógico , el procesamiento puede ocurrir en cualquier dominio. Los procesadores analógicos operan directamente sobre la señal eléctrica, mientras que los procesadores digitales operan matemáticamente sobre su representación digital.

Historia

La motivación para el procesamiento de señales de audio comenzó a principios del siglo XX con inventos como el teléfono , el fonógrafo y la radio que permitieron la transmisión y el almacenamiento de señales de audio. El procesamiento de audio era necesario para las primeras transmisiones de radio , ya que había muchos problemas con los enlaces entre el estudio y el transmisor . [1] La teoría del procesamiento de señales y su aplicación al audio se desarrolló en gran medida en Bell Labs a mediados del siglo XX. Los primeros trabajos de Claude Shannon y Harry Nyquist sobre teoría de la comunicación , teoría del muestreo ymodulación de código de pulso (PCM) sentó las bases para el campo. En 1957, Max Mathews se convirtió en la primera persona en sintetizar audio de una computadora , dando origen a la música por computadora .

Los principales desarrollos en la codificación de audio digital y la compresión de datos de audio incluyen la modulación de código de pulso diferencial (DPCM) de C. Chapin Cutler en Bell Labs en 1950, [2] la codificación predictiva lineal (LPC) de Fumitada Itakura ( Universidad de Nagoya ) y Shuzo Saito ( Nippon Telegraph and Telephone ) en 1966, [3] DPCM adaptativo (ADPCM) por P. Cummiskey, Nikil S. Jayant y James L. Flanagan en Bell Labs en 1973, [4] [5] codificación de transformada discreta de coseno (DCT) por Nasir Ahmed , T. Natarajan y KR Rao en 1974, [6] y la codificación de transformada de coseno discreta modificada (MDCT) de JP Princen, AW Johnson y AB Bradley en la Universidad de Surrey en 1987. [7] LPC es la base para la codificación perceptual y se usa ampliamente en la codificación de voz , [8] mientras que la codificación MDCT se usa ampliamente en formatos de codificación de audio modernos como MP3 [9] y codificación de audio avanzada (AAC). [10]

Señales analógicas

Una señal de audio analógica es una señal continua representada por un voltaje o corriente eléctrica que es análoga a las ondas de sonido en el aire. El procesamiento de señales analógicas implica alterar físicamente la señal continua cambiando el voltaje, la corriente o la carga a través de circuitos eléctricos .

Históricamente, antes del advenimiento de la tecnología digital generalizada , lo analógico era el único método para manipular una señal. Desde entonces, a medida que las computadoras y el software se han vuelto más capaces y asequibles, el procesamiento de señales digitales se ha convertido en el método de elección. Sin embargo, en las aplicaciones musicales, la tecnología analógica sigue siendo deseable, ya que a menudo produce respuestas no lineales que son difíciles de replicar con filtros digitales.

Señales digitales

Una representación digital expresa la forma de onda de audio como una secuencia de símbolos, generalmente números binarios . Esto permite el procesamiento de señales utilizando circuitos digitales como procesadores de señales digitales , microprocesadores y computadoras de propósito general . La mayoría de los sistemas de audio modernos utilizan un enfoque digital, ya que las técnicas de procesamiento de señales digitales son mucho más potentes y eficientes que el procesamiento de señales de dominio analógico. [11]

Aplicaciones

Los métodos de procesamiento y las áreas de aplicación incluyen almacenamiento , compresión de datos , recuperación de información musical , procesamiento de voz , localización , detección acústica , transmisión , cancelación de ruido , identificación acústica , reconocimiento de sonido , síntesis y mejora (por ejemplo , ecualización , filtrado , compresión de nivel , eco y reverberación) . eliminación o adición, etc.).

Transmisión de audio

El procesamiento de señales de audio se utiliza cuando se transmiten señales de audio para mejorar su fidelidad u optimizar el ancho de banda o la latencia. En este dominio, el procesamiento de audio más importante tiene lugar justo antes del transmisor. El procesador de audio aquí debe evitar o minimizar la sobremodulación , compensar los transmisores no lineales (un problema potencial con la transmisión de onda media y onda corta ) y ajustar el volumen general al nivel deseado.

Control de ruido activo

El control activo de ruido es una técnica diseñada para reducir el sonido no deseado. Al crear una señal que es idéntica al ruido no deseado pero con la polaridad opuesta, las dos señales se cancelan debido a la interferencia destructiva .

Síntesis de audio

La síntesis de audio es la generación electrónica de señales de audio. Un instrumento musical que logra esto se llama sintetizador. Los sintetizadores pueden imitar sonidos o generar otros nuevos. La síntesis de audio también se utiliza para generar voz humana mediante la síntesis de voz .

Efectos de audio

Los efectos de audio alteran el sonido de un instrumento musical u otra fuente de audio. Los efectos comunes incluyen distorsión , a menudo utilizada con guitarra eléctrica en blues eléctrico y música rock ; efectos dinámicos como pedales de volumen y compresores , que afectan el volumen; filtros como pedales wah-wah y ecualizadores gráficos , que modifican rangos de frecuencia; efectos de modulación , como chorus , flangers y phasers ; efectos de tono tales como cambiadores de tono; y efectos de tiempo, como reverberación y retardo , que crean ecos y emulan el sonido de diferentes espacios.

Músicos, ingenieros de audio y productores de discos usan unidades de efectos durante presentaciones en vivo o en el estudio, generalmente con guitarra eléctrica, bajo, teclado electrónico o piano eléctrico . Si bien los efectos se usan con mayor frecuencia con instrumentos eléctricos o electrónicos , se pueden usar con cualquier fuente de audio, como instrumentos acústicos , batería y voces. [12] [13]

Audición informática

La audición por computadora (CA) o la escucha de máquinas es un campo general de estudio de algoritmos y sistemas para la comprensión de audio por parte de una máquina. [14] [15] Dado que la noción de lo que significa que una máquina "oiga" es muy amplia y algo vaga, la audición por computadora intenta reunir varias disciplinas que originalmente se ocupaban de problemas específicos o tenían una aplicación concreta en mente. El ingeniero Paris Smaragdis , entrevistado en Technology Review , habla sobre estos sistemas: "software que utiliza el sonido para ubicar a las personas que se mueven por las habitaciones, monitorear la maquinaria en busca de averías inminentes o activar cámaras de tráfico para registrar accidentes". [dieciséis]

Inspirándose en modelos de audición humana , CA trata cuestiones de representación, transducción , agrupación, uso del conocimiento musical y semántica general del sonido con el fin de realizar operaciones inteligentes sobre señales de audio y música por parte de la computadora. Técnicamente, esto requiere una combinación de métodos de los campos de procesamiento de señales , modelado auditivo , percepción y cognición musical , reconocimiento de patrones y aprendizaje automático , así como métodos más tradicionales de inteligencia artificial para la representación del conocimiento musical. [17] [18]

Véase también

Referencias

  1. ^ Atti, Andreas Spanias, pintor de Ted, Venkatraman (2006). Procesamiento y codificación de señales de audio ([Online-Ausg.] ed.). Hoboken, Nueva Jersey: John Wiley & Sons. pag. 464. ISBN 0-471-79147-4.
  2. ^ Patente de EE. UU. 2605361 , C. Chapin Cutler, "Cuantización diferencial de señales de comunicación", emitida el 29 de julio de 1952 
  3. ^ Gris, Robert M. (2010). "Una historia del habla digital en tiempo real en redes de paquetes: Parte II de la codificación predictiva lineal y el protocolo de Internet" (PDF) . Encontrado. Proceso de Señal de Tendencias . 3 (4): 203–303. doi : 10.1561/2000000036 . ISSN 1932-8346 .  
  4. ^ P. Cummiskey, Nikil S. Jayant y JL Flanagan, "Cuantización adaptativa en la codificación de voz PCM diferencial", Bell Syst. tecnología J. , vol. 52, págs. 1105-1118, septiembre de 1973
  5. ^ Cummiskey, P.; Jayant, Nikil S.; Flanagan, JL (1973). "Cuantificación adaptativa en codificación PCM diferencial de voz". El diario técnico del sistema Bell . 52 (7): 1105-1118. doi : 10.1002/j.1538-7305.1973.tb02007.x . ISSN 0005-8580 . 
  6. Nasir Ahmed ; T. Natarajan; Kamisetty Ramamohan Rao (enero de 1974). "Transformada de coseno discreta" (PDF) . Transacciones IEEE en computadoras . C-23 (1): 90–93. doi : 10.1109/TC.1974.223784 .
  7. ^ JP Princen, AW Johnson y AB Bradley: Codificación de subbanda/transformación mediante diseños de banco de filtros basados ​​en la cancelación de alias en el dominio del tiempo , IEEE Proc. internacional Conferencia sobre Acústica, Habla y Procesamiento de Señales (ICASSP), 2161–2164, 1987.
  8. ^ Schroeder, Manfred R. (2014). "Laboratorios Bell" . Acústica, información y comunicación: volumen conmemorativo en honor a Manfred R. Schroeder . Saltador. pag. 388. ISBN 9783319056609.
  9. ^ Guckert, John (primavera de 2012). "El uso de FFT y MDCT en la compresión de audio MP3" (PDF) . Universidad de Utah . Consultado el 14 de julio de 2019 .
  10. ^ Brandeburgo, Karlheinz (1999). "MP3 y AAC explicados" (PDF) . Archivado (PDF) desde el original el 13 de febrero de 2017.
  11. ^ Zölzer, Udo (1997). Procesamiento de señal de audio digital . John Wiley e hijos. ISBN 0-471-97226-6.
  12. ^ Horne, Greg (2000). Método Completo de Guitarra Acústica: Dominar la Guitarra Acústica c . Alfred Music. pag. 92. ISBN 9781457415043.
  13. ^ Yakabuski, Jim (2001). Técnicas profesionales de refuerzo de sonido: consejos y trucos de un ingeniero de sonido de conciertos . Hal Leonard. pag. 139. ISBN 9781931140065.
  14. ^ "Audición de máquina: principios, algoritmos y sistemas" .
  15. ^ "Audición de máquina: principios, algoritmos y sistemas" (PDF) .
  16. ^ Paris Smaragdis enseñó a las computadoras cómo reproducir música más realista
  17. ^ Tanguiane (Tangian), Andranick (1993). Percepción Artificial y Reconocimiento Musical . Apuntes de clase en inteligencia artificial. vol. 746. Berlín-Heidelberg: Springer. ISBN 978-3-540-57394-4.
  18. ^ Tanguiane (Tanguiane), Andranick (1994). "Un principio de correlatividad de la percepción y su aplicación al reconocimiento de música". Percepción musical . 11 (4): 465–502. doi : 10.2307/40285634 .

Lectura adicional

0.044673919677734