|
|
Bien,
me has demostrado que el esquema-3 de MPEG-1 funciona muy bien en
ciertos campos. ¿Cuáles son sus límites?
-
Por
ejemplo, en lo referente a codificación de voz, un codec
dedicado, que explote las características de la voz humana,
como el CS-ACELP, obtendrá mejores resultados. El CS-ACELP
funciona muy bien incluso a 53 kbps. En esta tasa de bits
funciona mejor que el esquema-3, hay que reconocerlo, sobre todo
porque ofrece un retraso inferior a los 40 ms, lo cual lo hace
muy útil para las comunicaciones full-duplex.
¿Entonces
MPEG no ofrece soluciones para codificación de voz?
¿Es
lo mismo MPEG que ISO?
-
No,
no. MPEG es un grupo de expertos que trabajan bajo la dirección
conjunta de ISO e IEC, organizaciones internacionales, centrándose
en la codificación de audio y vídeo.
¿Qué
quieren decir las siglas?
¿Y
cómo consigo los documentos ISO que incluyen las especificaciones
MPEG?
-
Hay
que dirigirse al cuerpo de estándares nacional, en el caso
de España, AENOR, que los vende a los interesados. Se pueden
consultar en su biblioteca si el precio te parece excesivo, que
es lo más probable. La referencia adecuada en este caso
es ISO 11172-3.
¿Hay
algo de código escrito para el público?
-
Sí,
lo hay. Consulta la bibliografía. Debes saber, sin embargo,
que está escrito con propósitos educativos, principalmente.
¡No esperes encontrar un decodificador en C++ para tu uso y disfrute!
El código es muy valioso.
Sólo
hemos hablado de MPEG-1. ¿Qué hay de MPEG-2? ¿No utiliza los
mismos esquemas?
-
En
efecto, MPEG-2 utiliza los mismos tres esquemas de los que hemos
hablado, implícitamente, para MPEG-1. Lo único es
que MPEG-2 incluye un modo especial de funcionamiento para tasas
de bits especialmente bajas, utilizando frecuencias de muestreo
mitad que las habituales de 32, 441 y 48 Khz. y además
una extensión multicanal.
...¿extensión
multicanal?
-
De
acuerdo, de acuerdo. No me hagas entrar en muchos detalles, pero
la cuestión es que permite incluir cinco canales de audio
para ofrecer sonido "envolvente" (surround), siendo
los canales: izquierdo, derecho, central, envolvente izquierdo
y envolvente derecho. Además hay un sexto canal opcional
para mejorar las componentes a baja frecuencia, el canal de subwoofer.
Y por último, está la extensión multilingüe,
que permite la inclusión de otros siete canales de audio.
¿Y
cómo queda la compatibilidad MPEG-1 vs MPEG-2?
-
Pues
por raro que parezca, se mantiene, excepto en lo referente a las
nuevas frecuencias de muestreo, que un decodificador MPEG-1 puro
no podría resolver. Los canales extra se codifican dentro
de lo que hemos venido llamando datos adicionales, y sólo
el estéreo se codifica en la información de trama
pura, así que el decodificador MPEG-1 no tiene en cuenta
el sonido envolvente ni la extensión multilingüe, pero
funciona.
Por
cierto, he oído algo sobre MPEG-2.5...
-
Mmm.
Bueno, verás, el Instituto
Fraunhofer es uno de los pioneros en este campo, y sus productos
se cuentan entre los más utilizados. El caso es que para
tasas de bits excepcionalmente bajas, incluyeron en su codec esta
posibilidad que divide de nuevo las frecuencias de muestreo entre
dos. Funciona bien para ciertas aplicaciones de ancho de banda
crítico, pero recuerda que no es una especificación
ISO.
¿Por
qué aumenta tanto la complejidad del esquema-2 al esquema-3?
-
El
esquema-3 se conoce, en broma, como esquema-2++. Esto viene a
que conceptualmente es muy similar, pero utiliza toda una serie
de trucos que explotan la capacidad de computación de los
sistemas modernos, multiplica la resolución, utiliza codificación
entrópica, tramas variables y mejores métodos para
el joint stereo. Además de filtros híbridos y otras
sutilezas que puedes ver con cierto detalle en el punto 3. Algoritmos,
en fin, que no incluyen nada que podamos llamar innovador, pero
que a costa de aumentar mucho el retardo y la complejidad obtienen
estos resultados de compresión tan buenos.
Ya
veo. Bueno, pasemos a la calidad del sonido. ¿Realmente se mide de
forma subjetiva?
-
Pues
sí. Hoy día no hay alternativa a la realización
de estos tests, bastante caros, dicho sea de paso. Los hombres
y mujeres que se dedican a la escucha han sido entrenados, y evalúan
de 1 a 5 la calidad del sonido que se les presenta. Primero oyen
el original y luego, al azar, se les presenta o el original o
la señal codificada. Los resultados de los tests se han
probado siempre acertados.
¿Resultados?
Cuéntame alguno.
-
Bien,
el esquema-3 siempre se probó superior en tasas de bits
moderadas (64 kbps por canal), como por ejemplo en el test de
Septiembre de 1994 en NTT Japan. Siempre obtuvo notas entre 36
y 38, en comparación al esquema-2 con sus 21-26.
A finales del año 1993 se recomendó, por otra parte,
el esquema-2 a 180 kbps por canal para distribución de
sonido y 128 kbps por canal para emisión. El esquema-3
se recomendó para canales de 60 kbps utilizados como canales
de transmisión de voz.
¿Alguna
anécdota?
-
Curiosamente,
en este último test de 1993, se incluyó una nota
que hacía referencia a la voz masculina alemana, pues no
pasó las pruebas de calidad tan limpiamente como otros
elementos de voz probados, y de hecho no aprobó los requerimientos
(por muy poco). Se espera que en el futuro se resuelva el problema
|