Conecta con nosotros

Noticias

Spotify utiliza Whisper para doblar podcasts

Publicado

el

Spotify utiliza Whisper para doblar podcasts

Spotify acaba de realizar un movimiento maestro. Seguramente se han inspirado en otras acciones más o menos relacionadas que ya hemos visto en el pasado, como los planes de traducción automática de vídeos de YouTube, y también de audiolibros por parte de Apple,pero eso no le resta mérito en absoluto. Más bien al contrario, me parece que es el movimiento más inteligente llevado a cabo por la compañía en mucho tiempo y, si no obtiene una rápida respuesta por parte de sus principales competidores, sí que puede marcar una diferencia cuando un usuario no sepa si decidirse por una u otra plataforma.

Los podcasts, como ya hemos comentado en alguna ocasión, viven una segunda juventud que, en realidad, es incluso más explosiva que la primera, cuando Apple empezó a popularizar este formato de la mano del iPod. Así, los servicios de música en streaming, tras intentar competir (con muy poco éxito) en base a la exclusividad de sus catálogos (que es lo que están haciendo los servicios de cine y series), decidieron aprovechar este resurgir para competir con su propuesta de podcasts.

A este respecto, Spotify lleva ya mucho tiempo invirtiendo en este tipo de contenidos, si bien es cierto que hace un año anunció recortes en su división de podcasts, y que ya con anterioridad habíamos comprobado que parte de los grandilocuentes anuncios de contenidos exclusivos no llegaban a materializarse. No obstante, es innegable que a día de hoy, su oferta en este sentido es bastante interesante, y que ya supone una razón más que suficiente para elegir Spotify frente a su competencia.

Spotify utiliza Whisper para doblar podcasts

Ahora bien, con el anuncio que ha hecho la compañía a través de su blog, sí que nos encontramos con un movimiento ganador en este sentido, y es que Spotify está empleando Whisper, de OpenAI, junto con tecnología propia, para doblar los podcasts a otros idiomas. Por si no lo conoces, Whisper es un modelo basado en IA de reconocimiento de voz. El uso más extendido es la transcripción de audio, y una vez que el texto ya ha sido transcrito, se traduce y, a continuación, se emplea una solución de síntesis de voz (texto a voz), entrenada con la voz original, para replicar el contenido original, pero en el idioma de salida elegido, replicando la voz del creador.

Para las primeras pruebas de esta nueva función, Spotify ha trabajado con varios creadores, de modo que coincidiendo con el anuncio de esta nueva función ya estuvieran disponibles los primeros contenidos doblados empleando este sistema. Son los siguientes:

  1. Podcast de Lex Fridman – “Entrevista con Yuval Noah Harari”
  2. Experto en sillón : “Kristen Bell, por la gracia de Dios, regresa”
  3. El diario de un director ejecutivo con Steven Bartlett – “Entrevista con la Dra. Mindy Pelz”

Los originales fueron grabados en inglés, pero gracias a esta nueva propuesta de Spotify ya están disponibles en español, y en los próximos días se añadirán también versiones en francés y alemán.

El resultado no es perfecto, pero sí que resulta mucho más natural que otras propuestas de texto a voz, y brinda un alcance prácticamente global a los podcasts subidos a la plataforma, pues elimina la barrera idiomática para acceder a los podcasts. Así, ahora resultará clave el ritmo con el que se vayan publicando más versiones traducidas, de y a múltiples idiomas. Si Spotify actúa con celeridad en este sentido, se apuntarán un gran tanto a su favor.

Si me dieran una cana por cada contenido que he escrito relacionado con la tecnología... pues sí, tendría las canas que tengo. Por lo demás, música, fotografía, café, un eReader a reventar y una isla desierta. ¿Te vienes?

Lo más leído