M-JPEG, EDICIÓN NO LINEAL



 
      Existen múltiples sistemas de compresión de imágenes y video como hemos visto en el artículo anterior. Muy pocos de ellos se usan para editar video digital, el mas extendido  es sin duda el M-JPEG. Estas siglas significan Motion-JPEG, es decir, JPEG en movimiento. A su vez JPEG significa Joint Pictures Expert Group (unión de expertos en imagen) y son un conjunto de especificaciones técnicas para la compresión de imágenes estáticas, básicamente existen dos grandes sistemas uno con perdidas y otro sin ellas. Aquí hablaremos en todo momento del sistema con perdidas:
Baseline JPEG con cuantificación uniforme y 8x8 DCT  ( para mas datos ver cuadro 1)

      El M-JPEG no es mas que transformar una secuencia de frames (video) en una secuencia de imágenes comprimidas en formato JPEG. El motivo es reducir el tamaño de los ficheros y la velocidad de transferencia necesaria. Si transformáramos una secuencia de video (768x576) en una serie de imágenes en formato TGA un  solo segundo ocuparía entre 15 y 30 Megabytes, (eso lo podríamos llamar M-TGA) para poder manejar video de esta manera necesitaríamos que la tarjeta gráfica de nuestro equipo soportara velocidades de transferencia superiores a 30 MBytes/s. También necesitaríamos que el disco duro (HD) tuviera una velocidad de transferencia superior a la de la tarjeta gráfica. Por tanto un minuto de video almacenado de esta manera superaría ampliamente el Gigabyte de ocupación en disco duro. Como podemos observar esto nos llevaría a un equipo de unas características impresionantes, para solucionar todo esto existe el M-JPEG. 

      Los sistemas de edición de video digital no basados en cinta nos permiten acceder a cualquier parte de la secuencia a editar casi instantáneamente en lugar de tener que pasar “linealmente” la cinta hasta llegar al punto que buscamos, de ahí que sean llamado sistemas de edición no lineal.

 

      Básicamente un sistema de edición no lineal M-JPEG consiste en una tarjeta capturadora/reproductora de video. Dicha placa incorpora en el hardware un circuito integrado que es capaz de comprimir/descomprimir en formato JPEG a una velocidad de un fichero cada 0,01 segundos. Comprime o descomprime una imagen JPEG de 768x576 pixel en menos de una centésima de segundo y alcanzan unas velocidades de transferencia interna del orden de  20 Megabytes/s o mas. Esta tarjeta puede usar el  HD del ordenador al que esta conectada o disponer de uno para su uso exclusivo conectado directamente a la misma de los llamados discos AV (audio-video). Este tipo de HD poseen una alta velocidad de transferencia y respuesta uniforme en la transmisión de datos. Por supuesto necesitaríamos un/unos dispositvo/s de entrada y salida, por ejemplo un magnetoscopio como grabador y una cámara como fuente de señal.

      De esta manera se reducen drásticamentes los requerimientos de hardware descendiendo a velocidades de transferencia de entre 0,15 M a 5 M por segundo y de igual manera el almacenamiento se reduce a magnitudes del mismo orden. Por tanto con un equipo de unas características “normalitas” como un Pentium-III 600 con 64 MB de RAM y un par de HD de 10 GB  podemos disponer de una edición no lineal que funciona a una velocidad adecuada. Por supuesto debemos contar con un software de edición de video digital como Adobe Premiere por ejemplo, también necesitaremos un grabador/reproductor de video (recorder) y un monitor para poder observar el resultado real de nuestro trabajo. El motivo de tener dos HD es para separar el disco del sistema de el de video. Ya que es muy conveniente que el disco que usamos para video sea exclusivamente para esto, con lo que evitaremos fragmentaciones que reducirían su rendimiento. Si el HD de video va conectado directamente a la tarjeta M-JPEG es lo que suele llamarse DPR (Digital Player/Recorder) aunque en realidad es lo mismo solo que con mayores prestaciones. Una característica inherente al sistema JPEG es la posibilidad del ajuste calidad/tamaño, obviamente a mayor calidad mayor tamaño de fichero, de ahí las variaciones de tamaño-velocidad de transferencia en las cifras expuestas.

      El rango de ratios de compresión mas usado va desde 20:1 hasta 3:1 este ultimo se considera calidad Broadcast (calidad para emisión por TV). Estos niveles de compresión no se corresponden exactamente con el tamaño de los ficheros debido  a que se refieren a una compresión de la imagen en la que entran en juego diversos parámetros, a parte hay que tener en cuenta que es fácil conseguir comprimir un fichero gráfico a la mitad de su tamaño sin necesidad de perder datos. Por tanto en una compresión 2:1 el tamaño del fichero de video es inferior a la mitad. 
 

      Hay quien se pregunta porqué no se usa el formato MPEG para edición  no se usa debido a que en este formato existen pocos frames independientes y muchos existen en función de otros con lo que podemos encontrarnos con que para editar un frame tenemos previamente que recalcular sobre los seis anteriores y ademas el descomprimir-comprimir en MPEG ocasionaría unas perdidas de calidad considerables. Así que normalmente los pocos sistemas que aceptan como entrada una fuente de MPEG para edición lo primero que hacen es transformar el MPEG en un formato sin perdidas como el Raw. Por último os diremos que en breve la edición digital no lineal en red será el sistema estándar que encontraremos en cualquier sala o estudio profesional.

 
JPEG 
Como decíamos al principio del articulo el JPEG es un sistema de compresión con cuantificación uniforme 8x8 DCT y de linea base. Empecemos por la linea base, esto quiere decir que el método que se utiliza para transformar una imagen a formato JPEG es leyendo esta por lineas empezando por la parte superior y descendiendo progresivamente. El sistema de almacenamiento de una imagen consiste en descomponer esta en pixels organizados en una matriz bidimensional, es decir, en una cuadricula de X pixels de ancho por Y pixels de alto. Cada uno de estos pixels se descomponen en los tres colores básicos luz:    

- RGB, es decir se almacenan tres valores (R -red- rojo, G -green- verde y B -blue- azul) por cada pixel. 

El JPEG transforma este sistema separando el componente lumínico de cada pixel del cromático (El componente lumínico sería equivalente a una representación en escala de grises de la imagen). En este primer paso ya aplica una compresión al reducir la información de las componentes cromáticas pero sin perder nivel de detalle en la componente lumínica. Estas componentes están expresadas en niveles, pero mediante la aplicación de la Transformada Discreta del Coseno (DCT es una formula trigonométrica derivada a partir del análisis teórico de Fourier) se van transformando bloques de 8x8 pixels en una expresión distinta ya que en lugar de niveles se expresan coeficientes de frecuencia que reducen la cantidad de datos necesarios para su almacenamiento. A continuación se cuantifican estos coeficientes aplicando un redondeo donde existe la principal perdida de calidad y el ajuste del nivel de compresión. Por ultimo se aplica el algoritmo de Huffman que es un sistema de compresión sin perdidas y así obtenemos un archivo JPEG. 

Cuadro 1.

[VOLVER]