cover image
Web

Códecs de audio web

Con el auge del streaming de vídeo y las videollamadas, la necesidad de una buena calidad de audio es más importante que nunca. Este artículo te dará una visión general de los distintos códecs de audio que se utilizan en la web y cómo se comparan entre sí.

Códecs de audio

Un códec de audio es un componente de software o hardware que comprime o descomprime datos de audio digital. El término códec es la abreviatura de "codificador-decodificador", que se refiere al proceso de codificar los datos de audio para su transmisión o almacenamiento y decodificarlos para su reproducción.

Un códec de audio puede utilizarse para reducir el tamaño de los archivos de audio, facilitando su transmisión o almacenamiento. La compresión se consigue eliminando los datos redundantes o irrelevantes de la señal de audio, al tiempo que se mantiene su calidad general en la medida de lo posible.

WAV

El Waveform Audio Format (WAV) fue desarrollado conjuntamente por Microsoft e IBM en 1991. Normalmente, los datos de audio se almacenan sin comprimir en el formato de modulación lineal por impulsos codificados (LPCM). LCPM también se utiliza en los CD de audio. Almacena audio LPCM de dos canales muestreado a 44,1 kHz con 16 bits por muestra. Por tanto, es de alta calidad, pero su tamaño de archivo también es muy grande.

El gran tamaño del archivo lo hace inadecuado para el streaming de audio. También puede contener metadatos en el fragmento INFO. WAV es un formato de archivo de audio, así como un formato contenedor para otros formatos de audio.

MP3

MP3 es un formato de codificación para audio digital y fue creado por la Sociedad Fraunhofer en Alemania en 1991. Es un formato de compresión de audio con pérdidas. Así, se consigue una gran reducción del tamaño del archivo en comparación con otros formatos como WAV. Sin embargo, también se reduce la calidad. Utiliza el modelado psicoacústico para eliminar las partes del audio que no percibe el oído humano. MP3 es el formato de audio más popular en la web. Es compatible con los principales navegadores. El formato MP3 está libre de patentes en la Unión Europea y Estados Unidos.

AAC

AAC (Advanced Audio Coding) es un formato de compresión de audio con pérdidas. Fue desarrollado por un consorcio de diferentes empresas, entre ellas Bell, Fraunhofer y Sony, en 1997. Se diseñó como sucesor del formato MP3.

AAC es un formato de compresión de audio con pérdidas. Se utiliza en muchos productos de Apple como iTunes e iPod. Android también es compatible con este formato. La compatibilidad con los navegadores no es tan buena como para MP3, pero sigue siendo compatible con los principales navegadores. Debido a problemas de patentes, Firefox solo soporta AAC cuando el sistema operativo lo soporta. En Chromium no hay soporte para AAC. Es un estándar abierto, pero no es gratuito.

FLAC

FLAC (Free Lossless Audio Codec) es un formato de compresión de audio sin pérdidas. Fue desarrollado por Josh Coalson en 2001 y ahora lo administra la fundación Xiph.org.

Al ser sin pérdidas, no reduce la calidad del audio. FLAC no está cubierto por ninguna patente y es de código abierto y libre de derechos. La reproducción de FLAC es compatible con los principales navegadores (excepto Opera) y sistemas operativos.

ALAC

ALAC (Apple Lossless Audio Codec) es un formato de compresión de audio sin pérdidas. Fue desarrollado por Apple en 2004. Se utiliza en productos de Apple como iTunes e iPod. Desarrollado como propietario por Apple, ahora es un formato de código abierto. Pero el soporte multiplataforma no es bueno.

En cuanto a navegadores, solo el navegador Safari lo soporta. En cuanto a sistemas operativos, solo macOS e iOS lo soportan.

G.711

G.711 se diseñó específicamente para su uso en telefonía en 1972. G.711 pasa señales de audio en el rango de 300-3400 Hz y las muestrea a una velocidad de 8.000 muestras por segundo. Así, únicamente capta la voz humana, el resto de la información se descarta. La norma está gestionada por la organización ITU-T. Todas las patentes han caducado y se puede utilizar gratuitamente. Este códec es ahora compatible con los principales navegadores web en relación con WebRTC.

G.722

G.722 es un códec de audio de 7 kHz de la UIT desarrollado en 1988. Al igual que G.711, se utiliza principalmente en telefonía. En G.722, la señal de audio se codifica mediante modulación por impulsos codificados diferencial adaptativa (ADPCM), en la que cada muestra se representa no por su valor absoluto, sino como un valor que indica en qué medida la nueva muestra difiere de la anterior. G.722 está soportado actualmente por los principales navegadores web en conexión con WebRTC.

Vorbis

La fundación Xiph.org desarrolló Vorbis como una alternativa de código abierto a MP3. Publicado inicialmente en 2000, es un formato de compresión de audio con pérdidas. Dependiendo del ajuste de calidad utilizado durante la codificación, la tasa de bits resultante puede variar entre 45 kbps y 500 kbps.

Al no contar con el respaldo financiero de una gran empresa, no está tan extendido como el MP3. Sin embargo, es compatible con los principales navegadores, excepto Safari. Vorbis suele utilizarse en el formato contenedor Ogg o WebM.

Opus

Al igual que Vorbis, Opus también fue desarrollado por la fundación Xiph.org. Presentado como sucesor de Vorbis, lo mejora en múltiples aspectos. En especial, tiene baja latencia, lo que lo hace ideal para la comunicación en tiempo real. Se trata de un buen códec de audio de uso general que puede tratar con eficacia tanto audio de baja complejidad, como el habla, como música y otros sonidos de alta complejidad.

Como códec, es gratuito y de código abierto. También está libre de patentes. Fue estandarizado por el IETF en el RFC 6716. Opus es compatible con los principales navegadores. También puede utilizarse en WebRTC. También es compatible con los principales sistemas operativos, aunque dentro de contenedores diferentes.

Conclusión

Como puedes ver, hay muchos formatos de audio diferentes. Por ejemplo, MP3 es el formato más popular, pero no es de código abierto. Para aplicaciones de voz, G.711 y G.722 son buenas opciones. Pero el códec de propósito general Opus puede ser la mejor opción para la mayoría de las aplicaciones, ya que es libre, de código abierto, sin patentes y soportado por los navegadores modernos.

Referencias

Published 3 Mar 2023

Creative Commons License
.
Thomas Derflinger

Escrito por Thomas Derflinger

Soy un empresario visionario y desarrollador de software. En este blog escribo principalmente sobre programación web y temas relacionados como el IoT.