-->    
     

Para algunos editores, las voces sintéticas son una forma de aprovechar la creciente demanda de audiolibros, un segmento más saludable que otros sectores del negocio de los libros. Los ingresos totales de las editoriales de libros de Estados Unidos disminuyeron ligeramente entre 2015 y 2020, pero los ingresos de los audiolibros aumentaron 157%, según la Asociación de Editores Estadounidenses. Los “lectores” se han sentido cada vez más cómodos con este formato, ayudados por las mejoras técnicas en las aplicaciones móviles, las bocinas inteligentes y los audífonos inalámbricos. Pero debido al costo de un narrador y la producción de audio, la mayoría de los títulos nunca se convierten en audiolibros, particularmente en las editoriales más pequeñas (y mucho menos en español).

Por su lado, en los últimos años las voces sintéticas se han vuelto menos irritantes, y la evolución de los últimos cinco años es sorprendente, en parte debido a la investigación en inteligencia artificial de empresas como Google y Amazon, que compiten para ofrecer asistentes virtuales y servicios en la nube con tonos artificiales más suaves. Esos avances también se han utilizado para hacer “deepfakes”, que falsifican la realidad.

Speechki es una de varias empresas emergentes que desarrollan síntesis de voz para audiolibros. Analiza el texto con un software interno para indicar cómo declinar diferentes palabras, y lo expresa con tecnología adaptada de proveedores en la nube, incluidos Amazon, Microsoft y Google, y emplea oyentes de prueba que verifican los errores. Google está probando su propio servicio de “narración automática” que los editores pueden usar para generar audiolibros en inglés de forma gratuita, utilizando más de 20 voces sintéticas diferentes.

El portavoz de Google, Dan Jackson, dice que sus libros narrados automáticamente complementan en lugar de remplazar los libros narrados profesionalmente. “Nuestro objetivo con la narración automática es hacer posible la creación de un audiolibro de bajo costo y aumentar la accesibilidad del contenido para aquellos que no pueden leer a través de un libro electrónico”, dice.

Dos empresas dedicadas de lleno a explotar esta tecnología son Speechki y DeepZen, y ambas opinan que no son una amenaza para los narradores profesionales porque su tecnología se usará para hacer audiolibros que de otro modo no se habrían grabado. “La narración humana y la sintética pueden prosperar juntas; hay mucho trabajo”, dice Bill Wolfsthal, un veterano de la industria del libro que ayuda a Speechki con el desarrollo comercial.

Mientras se siguen desarrollando soluciones, los editores esperan que las voces generadas por computadora los ayuden a aprovechar la creciente demanda, pero algunos fanáticos, y Amazon (Audible no produce ni comercializa títulos narrados por inteligencia artificial), se resisten a los robots.

Fuente: Proyecto 451 y Wired