En los últimos días han salido algunas noticias importantes relacionadas con la IA, y en particular con los modelos generativos.
Los modelos generativos basados en IA se utilizan principalmente para imágenes, además de para videos y textos, y están volviéndose cada vez más realistas.
Summary
Modelos generativos de IA más potentes: las últimas noticias
Una noticia importante al respecto es la de Stability AI, que ha anunciado el lanzamiento de Stable Diffusion 3.5, modelo de generación de imágenes AI open source.
Se trata de una versión abierta que incluye múltiples variantes altamente personalizables según sus dimensiones, ejecutables en hardware de consumo y gratuitas para uso tanto comercial como no comercial, según la licencia permisiva Stability AI Community License.
Se pueden descargar Stable Diffusion 3.5 Large y Stable Diffusion 3.5 Large Turbo de Hugging Face, incluido el código en GitHub. Stable Diffusion 3.5 Medium en cambio será lanzado el 29 de octubre.
Stable Diffusion 3.5
Stable Diffusion 3.5 es el modelo generativo AI más potente creado hasta ahora por Stability AI.
En junio habían lanzado Stable Diffusion 3 Medium, la primera versión abierta de la serie Stable Diffusion 3, que sin embargo no había cumplido completamente con las expectativas de la comunidad.
Así, después de haber escuchado el feedback de la comunidad misma, Stability AI ha desarrollado una nueva versión para avanzar en su misión de transformar los medios visuales.
Stable Diffusion 3.5 quiere proporcionar a los creadores herramientas ampliamente accesibles, de vanguardia y gratuitas para la mayoría de los casos de uso, y ofrece una variedad de modelos desarrollados para satisfacer las necesidades de investigadores científicos, aficionados, startups y empresas.
Esta versión es uno de los modelos generativos de imágenes basados en IA más personalizables y accesibles en el mercado, con sin embargo al mismo tiempo un rendimiento de alto nivel en términos de pronta adherencia y calidad de la imagen.
Noticias de IA y actualizaciones en el campo de los modelos generativos: la gestión autónoma del mouse y del teclado
Pero hay más.
Anthropic ha anunciado el lanzamiento de una nueva versión beta de su modelo basado en IA, Claude, que permitirá a los desarrolladores que trabajan con la API tomar incluso el control del cursor del mouse, para hacer clic en botones y campos e insertar texto de manera autónoma.
Esta actualización permite de hecho a los desarrolladores indicar a Claude que use las computadoras como lo hacen las personas, es decir, mirando una pantalla, moviendo un cursor, haciendo clic en los botones y escribiendo texto. Según Anthropic, Claude 3.5 Sonnet es el primer modelo de IA en ofrecer el uso de la computadora en la beta pública, aunque en esta fase todavía es experimental hasta el punto de resultar a veces engorroso y sujeto a errores.
Ya están experimentando con esta nueva funcionalidad Asana, Canva, Cognition, DoorDash, Replit y The Browser Company.
La actualización de Claude 3.5 Sonnet está disponible para todos los usuarios.
Noticias negativas
No hay, sin embargo, solo noticias positivas sobre el desarrollo de los modelos generativos de AI.
Por ejemplo, Penguin Random House (PRH) ha introducido una nueva declaración en las páginas del copyright, tanto de los libros nuevos como de los reimpresos, en la que se afirma que ninguna parte de sus libros puede ser utilizada o reproducida de ninguna manera con el propósito de entrenar tecnologías o sistemas de inteligencia artificial.
PRH es el editor comercial más grande del mundo, y por lo tanto podría servir de ejemplo desde este punto de vista.
La declaración cita una directiva del Parlamento Europeo, y tiene como objetivo prohibir el uso de sus textos a las empresas de inteligencia artificial para el desarrollo de chatbot y otras herramientas digitales.
Por otro lado, en los EE.UU. ya han surgido varios casos de violación de derechos de autor en este sentido, tanto que muchos libros ya se han utilizado sin autorización para entrenar herramientas de inteligencia artificial.
PRH es el primero entre los Big Five de los editores comerciales anglófonos en modificar su información sobre el copyright para tales fines.
Aceleraciones y frenadas
Como ocurre prácticamente siempre, un nuevo sector en rápida expansión produce fuertes aceleraciones y grandes frenadas.
El problema en estos casos es que las aceleraciones podrían llevarlo muy adelante, tanto que las frenadas podrían solo ralentizar la aceleración sin lograr detenerla.
Sin embargo, no es todo oro lo que reluce, y en todas las evoluciones siempre hay también un componente de destrucción.
En este caso, el riesgo es el de destruir el modelo de negocio de algunos de aquellos que producen información, y de hacerlo recurriendo de hecho al robo de la propiedad intelectual.
Tampoco se dice que los legisladores sean capaces de seguir estas rápidas evoluciones, por lo tanto, podría tomar un poco de tiempo antes de que todas las cuestiones más delicadas sean examinadas, y tal vez resueltas.
Lo que está claro, sin embargo, es que no se trata solamente de una moda, o de un fuego de paja, sino de uno de esos grandes saltos hacia adelante que ha llevado a la sociedad humana a dominar sin oposición este mundo.