SGCG

…esto no es un subtítulo…

Ir a: contenido categorías calendario archivo suscripción

Volver arriba

Cambios en el sistema de distribución de vídeos de RTVE

2010-04-10

Hace unas semanas, vimos un método para descargar vídeos de la mediateca de RTVE. Anoche recibí un mensaje en el que un buen ciudadano (un saludo y muchas gracias, A) me avisaba de que el método dejó de funcionar debido a cambios realizados en el sistema de distribución de vídeo. Aun suponiendo que los cambios han sido realizados de forma bienintencionada, la situación es censurable: debemos recordar que los vídeos de RTVE han de ser patrimonio de todos los españoles.

Actualización: después de leer este artículo, es recomendable leer la continuación, ya que hay algunos vídeos para los que es necesario modificar ligeramente el método.

Actualización: para saber cómo trabajar con programas de audio (como programas de radio), es recomendable leer una nueva continuación de este artículo.

Actualización: las anteriores versiones del método han quedado obsoletas y ya no funcionan; la última está descrita en un artículo del mes de abril de 2011.

Nuevo programa

Actualización: hay una versión más reciente del programa. Está descrita en la continuación de este artículo y funciona con algunos vídeos excepcionales para los que la versión 2.0 falla.

Actualización: como las anteriores versiones del método han quedado obsoletas y ya no funcionan, es recomendable echarle un vistazo a la última versión del programa, descrita en un artículo del mes de abril de 2011.

Tenemos una nueva versión del programa para descargar vídeos de la mediateca que es compatible con el nuevo sistema. Los requisitos son los de siempre: una máquina *NIX con conexión a Internet y GNU Wget instalado. He aquí la dirección de descarga del tarball con el código:
rtve-mediateca-dl-2.0.tar.gz.

Para instalar el programa, hay que extraer el contenido del tarball, echarle un vistazo al Makefile y editarlo si es necesario y, finalmente, instalar:
make install

El funcionamiento del programa está documentado en una página de manual:
man rtve-mediateca-dl
También es posible acceder a la ayuda del programa con la opción --help:
rtve-mediateca-dl --help

Actualización:
Los usuarios de la distribución de software Arch Linux tienen la posibilidad de instalar rtve-mediateca-dl desde AUR con su herramienta favorita. Por ejemplo, con el popular programa yaourt:
yaourt -S rtve-mediateca-dl

Actualización:
El programa informático rtve-mediateca-dl es software libre y se distribuye bajo los términos de la licencia GNU GPL versión 3 ó posterior.

Cómo funciona el nuevo método para descargar los ficheros de vídeo

Una pequeña investigación ha permitido descubrir el funcionamiento del nuevo sistema. Algunas cosas siguen como antes; en concreto, el identificador del vídeo que extraíamos del código JavaScript de la página con el reproductor de vídeo incrustado sigue siendo el mismo. Vamos a ver, paso por paso, cómo podemos usar esta información para recuperar la dirección del fichero de vídeo.

  1. Supongamos que el número identificador es A1A2A3A4A5A6, donde cada letra con subíndice representa un dígito. Este número aparece en varios lugares como las variable flashcontentId y assetID.
  2. Vigilamos las comunicaciones de nuestro navegador y descubrimos la descarga del fichero http://www.rtve.es/swf/data/es/videos/video/A6/A5/A4/A3/A1A2A3A4A5A6.xml. La dirección se construye con los 4 últimos dígitos del número en orden inverso y con separadores de directorio entre dígitos y, finalmente, con el número completo.
  3. Descargamos el fichero XML. Tiene varios elementos, pero el último es el más interesante. Indica la carga de un complemento llamado multicdn (cdn como en content delivery network, red de entrega de contenidos). Tiene un parámetro que se llama assetDataID cuyo valor es un número de varias cifras: B1B2B3B4B5B6.
  4. A partir de aquí, el análisis de la actividad de nuestro navegador revela poca información la comunicación empieza a estar ofuscada, pero si nos quedamos un rato mirando fijamente el complemento de la red de entrega de contenidos, descubrimos muchas cosas. Resulta que podemos construir la dirección de otro recurso XML de un modo semejante al anterior, pero esta vez usando el nuevo número de assetDataID. Esta dirección tiene el siguiente aspecto: http://www.rtve.es/scd/CONTENTS/ASSET_DATA_VIDEO/B6/B5/B4/B3/ASSET_DATA_VIDEO-B1B2B3B4B5B6.xml. Igual que antes, usamos los cuatro últimos dígitos del número en orden inverso y con separadores de directorio entre ellos y, finalmente, el número completo.
  5. Descargamos el nuevo recurso XML. ¡Está lleno de información sobre el vídeo que queremos bajar! Rápidamente, identificamos la presencia de una dirección relativa: /…/ZZZZZZZZZZZZZ.flv. Aparece dos veces: en un parámetro llamado defaultLocation y en un campo llamado ASD_FILE.
  6. Nos inventamos una dirección que probablemente será la correcta: añadimos el prefijo http://www.rtve.es a la dirección que descubrimos en el anterior paso.
  7. Descargamos el contenido de la dirección que acabamos de construir. ¡Tenemos éxito! Queda ver cuánto tiempo pasará hasta que este método deje de funcionar, por supuesto.

Actualización: después de leer este artículo, es recomendable leer la continuación, ya que hay algunos vídeos para los que es necesario modificar ligeramente el método.


Categorías: Informática

Permalink: http://sgcg.es/articulos/2010/04/10/cambios-en-el-sistema-de-distribucion-de-videos-de-rtve/