Modulo 04: Formatos de y Sistemas de Grabación de Audio

Presentación: Audio Digital

Texto Módulo de Sonido I: Documento No 05

Lectura sugerida

 

1. Sistemas analógicos vs Digitales.

 

En temas anteriores se ha estudiado la diferencia entre los formatos analógico y digital en el tratamiento de los datos. Esta diferencia supone, resumidamente, que mientras el entorno analógico conserva la continuidad e integridad de la señal original a transportar, con el inconveniente de incorporar "ruido" o parásitos electrónicos debidos al propio medio de transporte, el entorno digital, en cambio, supone la codificación numérica de los datos originales; ello permite conservar con precisión y durabilidad mucho mayor los datos obtenidos, a costa de fragmentar la información original, de modo que aunque el sistema digital sea "teóricamente" mejor, su calidad queda limitada a la calidad de digitalización.

 

Ambos sistemas suponen un modo muy distinto de trabajo, una vez que la señal acústica ha sido introducida en el entorno electrónico. Para almacenar los datos, en un formato u otro, será necesario un soporte capaz de mantener esos datos durante un cierto tiempo; será deseable además que sea un medio que se pueda sobrescribir. El medio magnético ha sido, durante mucho tiempo, el soporte ideal para gran variedad de datos: ofrece una alta remanencia magnética (capacidad para retener información inducida magnéticamente), y permite almacenar datos analógicos o digitales.

Resumidamente, la grabación en cinta magnética se basa en la combinación de un soporte compuesto de millones de partículas de aleación magnetizable, con un cabezal electromagnético capaz de inducir la polarización de dichas partículas, aplicando la intensidad y la frecuencia que posee la señal original, en el caso de datos analógicos, o la codificación de ceros y unos que suponen los datos digitales.

 

Esto significa que un mismo medio de almacenamiento (en este caso, la cinta magnética) puede servir indistintamente para la grabación de datos analógicos o digitales: la diferencia está en la codificación de los datos almacenados; es el caso de los formatos Cassette, respecto a DAT. Los sistemas basados en disco no son muy distintos: base de partículas magnéticas combinadas con cabezal inductor; la única diferencia estriba en el modo de transporte del medio, que en este caso es rotacional, de varias capas y con varios cabezales. Aunque se usa sólo para grabación de datos digitales, técnicamente puede permitir la grabación analógica, aunque la capacidad seria insignificantemente pequeña comparada con la del formato de datos digitales.

2. Formatos de audio (comprimidos y no comprimidos)

  • Formatos de audio no comprimido: wav, aiff.

Las muestras recogidas ocupan un espacio en el soporte de almacenamiento que depende de la frecuencia de de muestreo y del Número de bits utilizado. El tamaño que ocupan es fácilmente calculable. Antes de pasar a comentar una fórmula útil para calcular su tamaño, conviene razonar antes su tamaño de forma intuitiva. A grandes rasgos se puede conocer cuanto ocupa un minuto de grabación en estéreo con la resolución de un CD. Si es sabido que un CD-ROM permite almacenar, a grandes números, unos 700 Mb de información y que un CD de audio dura unos 74 minutos de música, es fácil deducir que 1 minuto en estéreo (dos pistas) a 44,1 Khz. y 16 bits ocupará del orden de 10 Mb. En otras palabras, cada pista ocupa 5Mb por minuto. Teniendo esto presente, se puede pasar a calcular el tamaño de cualquier muestra.

 

En el entorno de un ordenador, estos datos se almacenan habitualmente como archivos de tipo WAV (Microsoft Wave), AIFF (Audio Interchange File Format) o SDII. En los dos primeros formatos, el tamaño de los datos es el mismo, la única diferencia se encuentra en la cabecera previa a los datos, donde se halla información respecto a los archivos En todos estos casos, se trata de audio sin compresión de datos, es decir, no hay ninguna reducción en el tamaño de los datos. Esta compresión no tiene nada que ver con la dinámica, sino que solo afecta al tamaño los datos. Como regla general, en audio profesional debe evitarse cualquier formato de archivo comprimido a no ser que sea estrictamente necesario.

  • formato del cd

El conocido CD (Compact Disc, o Disco Compacto) nació en 1980 de la iniciativa conjunto de las multinacionales Sony y Philips. Obtuvo rápidamente un reconocimiento de los fabricantes de audio y ha seguido su imparable ascenso hasta nuestros días, en los que su posición como estándar indiscutible está ya cuestionada y herida de muerte. Se comenta aquí brevemente su versión para audio, el CD audio o CD-A.

 

Un CD es un sistema óptico de almacenamiento de datos que en su versión para audio contiene audio a 44,1 kHz de frecuencia de muestreo y 16 bits dé resolución. Su respuesta en frecuencia va de 20 a 20.000 Hz y su rango dinámico teórico es de 96 dB. El soporte de la información es un disco plástico de 12 cm de diámetro grabado a una sola cara y compuesto por cuatro capas de distintos materiales y espesor: 1. la tinta de la etiqueta del disco (5 fAm), 2. Una capa plástica de protección (10-30 fAm), 3. Una capa reflectante metalizada (0,11 fAm) y 4. Una capa de policarbonato transparente llamada sustrato (1,2 mm). Es muy destacable que la parte inferior del CD (por donde se leen los datos) es la más gruesa, a diferencia de la superior que apenas tiene unas micras de espesor. ¡La cara superior es mucho más delicada que la inferior! Los datos codificados en el disco son leídos por un láser que incide sobre la superficie metalizada del disco y son interpretados por un fotodetector.

 

En un CD musical, antes de los datos de audio, se encuentra una cabecera global llamada TOC (Table of Contents) donde se encuentran datos como la cantidad de pistas, la duración total del CD, y la posición de inicio y final de cada tema. Por ello al introducir un CD en un equipo de música se pueden conocer rápidamente estos datos sin tener que examinar el disco completo. Para que los discos CD puedan ser leídos por cualquier reproductor, esta información tiene que escribirse siguiendo la llamada norma Red Book (Libro rojo). Esta norma constituye el conjunto de códigos y especificaciones industriales por las que debe regirse la fabricación y duplicación de discos compactos.

  • Compresión de datos en audio (minidisc, mpeg II mpeg III-mp3)

Un formato comprimido de audio consiste en la reducción del tamaño de los datos con la finalidad de facilitar su almacenamiento, transporte y tratamiento. En sistemas software, la compresión de datos se basa en la repetición de patrones en los datos, que permite eliminar redundancias, pero en cambio, en audio raramente se producen patrones repetitivos, por lo que la compresión se convierte en algo más complejo.

Los sistemas Minidisc (Sony) y DCC (Philips) aplican compresión en tiempo real al grabar los datos, y se fundamentan sobre los principios de umbral de audición y enmascaramiento. Aplicando el primer principio, se eliminan todas aquellas muestras que que quedan por debajo de O dBsPL; huelga decir que O dBsPL es el nivel de presión al cual empezamos a percibir sensación auditiva, pero ello no significa que realmente no haya señal. Según el principio de enmascaramiento, cuando dos señales simultáneas de nivel muy distinto y frecuencias cercanas se producen, nuestro oído no puede percibir la más débil, por lo que no es necesario almacenar la que no se oye.

 

Tanto el Minidisc como el DDC suponen reducción del tamaño de los datos, pero también reducción de la calidad pues se elimina información, y no todos los oídos tienen los mismos umbrales de sensibilidad auditiva. El mercado ha eliminado al DCC, pero no a ell Minidisc, cuya compresión sigue resultando apta para el ámbito doméstico.

 

Los algoritmos matemáticos como MPEG Layer II o MPEG Layer III (MP3) realizan una compresión basada en vectores matemáticos que permiten comprimir el tamaño de los archivos en proporciones de hasta 10 a 1 sin una pérdida de calidad dramática. La popularización del audio digital en Internet y su inclusión en una gran diversidad de sistemas portátiles hacen de este algoritmo un estándar hoy en día en cuanto a audio en Internet se refiere. No obstante, hay que recordar una vez más que no es un formato con el que se deba trabajar profesionalmente por motivos obvios. Aparte de estos sistemas, existen otros múltiples más y menos complejos. No obstante, cabe comentar la utilización del complejo sistema AC-3 de Dolby (conocido como Dolby Digital) en sonido multicanal y