OpenAI ha anunciado nuevas actualizaciones para Chatgpt. Ahora, esta herramienta puede ver, escuchar y hablar, marcando un hito en la interacción humano-IA. De este modo, los usuarios podrán tener conversaciones de voz, personalizar su experiencia con cinco voces únicas y compartir imágenes para obtener respuestas detalladas. Estas características, implementadas para usuarios Plus y Enterprise, ofrecen una experiencia más rica y envolvente.
Algunas de las funciones que se están implementando son: Habla con Chatgpt y haz que responda; Escucha mensajes de voz; Habla sobre imágenes; Muestra una o más imágenes a Chatgpt. El objetivo de OpenAI es construir una AGI (Inteligencia Artificial General) que sea segura y beneficiosa, abriendo las herramientas disponibles de manera gradual, mientras realizan mejoras y refinan las mitigaciones de riesgos con el tiempo. Esta estrategia se vuelve aún más importante con modelos avanzados que involucran voz y visión.
La nueva tecnología de voz, capaz de crear voces sintéticas realistas a partir de sólo unos pocos segundos de habla real, abre puertas a muchas aplicaciones creativas y centradas en la accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraudes.
Por eso, esta tecnología se está usando para alimentar un caso específico: la charla por voz. Por ejemplo, Spotify está utilizando el poder de esta tecnología para la prueba piloto de su función de traducción de voz, que ayuda a los podcasters a ampliar el alcance de sus historias traduciendo podcasts a idiomas adicionales en las propias voces de los podcasters.
Los modelos basados en visión también presentan nuevos desafíos. Antes de una implementación más amplia, el modelo se probó con equipos de redacción para evaluar el riesgo en dominios como el extremismo y la competencia científica, y con un conjunto diverso de pruebas alfa. La investigación permitió llegar a algunos detalles clave para el uso responsable.
Estas nuevas capacidades se irán implementando poco a poco durante los próximos meses y es seguro que serán fundamentales en el desarrollo de la industria editorial, por lo que es conveniente comenzar a explorarlas en el corto plazo.