Nvidia ha lanzado Nemotron, una versión avanzada de Llama-3.1, diseñada para superar los modelos de inteligencia artificial (IA) más avanzados, incluyendo GPT-4.
Gracias a datos cuidados y hardware innovador, Nemotron promete prestaciones sin igual en el panorama de la inteligencia artificial. Veamos en este artículo todos los detalles.
Summary
Nemotron de Nvidia supera a GPT-4o y Claude-3 gracias a una potencia de cálculo AI sin precedentes
Como se anticipó, Nvidia ha presentado su nuevo modelo de inteligencia artificial, Llama-3.1-Nemotron-70B-Instruct, con un impacto disruptivo.
Este modelo, según lo afirmado por Nvidia, promete superar los sistemas de IA más avanzados actualmente en circulación, como GPT-4o de OpenAI y Claude-3 de Anthropic.
El anuncio, hecho a través de una publicación en X desde la cuenta Nvidia AI Developer, rápidamente capturó la atención de los expertos del sector.
El modelo Nemotron representa una versión modificada y mejorada del Llama-3.1-70B-Instruct de Meta, una plataforma AI open source.
La modificación realizada por Nvidia, destacada por la parte «Nemotron» del nombre, refleja la contribución tecnológica significativa de la empresa, que ha llevado el modelo a nuevas alturas de potencia y versatilidad.
La idea fundamental es que este modelo pueda ser más «útil» y performante respecto a los modelos más populares como GPT-4 y Claude-3, gracias a un refinado trabajo de ajuste y a una infraestructura de hardware de vanguardia desarrollada por la misma Nvidia.
Nemotron nace dentro del contexto de la arena de los chatbot, conocida como lmarena, un espacio donde diferentes modelos de inteligencia artificial son comparados.
Meta, con su serie de modelos AI denominada «Llama», ha proporcionado la base sobre la cual Nvidia ha construido este nuevo sistema.
El objetivo principal era crear un modelo de IA de código abierto que fuera accesible para los desarrolladores para personalizaciones adicionales.
Sin embargo, Nvidia ha querido ir más allá, poniendo en juego sus recursos para crear un sistema de inteligencia artificial capaz de rivalizar y superar a los líderes del sector.
¿Qué distingue a Nemotron?
Uno de los elementos clave que ha permitido a Nemotron emerger es el uso de set de dati cuidadosamente seleccionados y procesos de ajuste altamente sofisticados.
Nvidia ha aprovechado sus enormes capacidades de cálculo, utilizando hardware de vanguardia, para empujar el modelo Llama-3.1-70B más allá de sus límites iniciales.
Esto ha permitido crear una versión de AI no solo más potente, sino también más «útil» desde el punto de vista práctico.
Un término que, en el ámbito de la inteligencia artificial, puede tener múltiples interpretaciones, pero que generalmente se refiere a la capacidad del modelo de proporcionar respuestas pertinentes, precisas y oportunas.
El benchmarking es uno de los métodos utilizados para evaluar la eficacia de un modelo de inteligencia artificial. Sin embargo, no existe una metodología única y definitiva para determinar cuál modelo es «el mejor».
Esto se debe a que la utilidad y la eficiencia de un modelo AI dependen a menudo de evaluaciones subjetivas y del contexto en el que se utiliza.
El benchmarking, de hecho, consiste en someter varios modelos AI a las mismas pruebas y evaluar los resultados obtenidos en términos de utilidad y precisión.
En el caso de Nemotron, Nvidia afirma que su nuevo modelo supera con amplio margen a los principales competidores, entre los que se incluyen GPT-4o y Claude-3.
La competencia en la arena de los chatbot es intensa, y Nemotron parece listo para escalar las clasificaciones.
Aunque aún no está completamente listado en las clasificaciones oficiales de lmarena, Nvidia sostiene que su modelo ha obtenido una puntuación de 85 en la prueba «Difícil». Una evaluación que, si se confirma, lo posicionaría en la cima de esta categoría particular.
Este resultado sería aún más notable considerando que Llama-3.1-70B, la base del Nemotron, es un modelo de nivel medio en comparación con la versión 405B de Llama-3.1, mucho más compleja y con un número de parámetros significativamente mayor.
Base de código abierto y otros parámetros
Para dar una idea de las dimensiones y la complejidad de los modelos AI, GPT-4o, uno de los modelos más avanzados de OpenAI, ha sido desarrollado con más de 1 billón de parámetros.
El número de parámetros es uno de los indicadores clave del poder y la capacidad de un modelo de inteligencia artificial.
Sin embargo, Nvidia parece haber logrado maximizar el rendimiento de Nemotron a pesar del número relativamente inferior de parámetros en comparación con GPT-4o.
Otro aspecto interesante de Nemotron es su base open source, que lo hace accesible a una amplia comunidad de desarrolladores.
Este enfoque de código abierto tiene el potencial de acelerar aún más los avances en el campo de la inteligencia artificial, ya que permite a expertos de todo el mundo contribuir a la mejora y personalización del modelo.
Además, el hecho de que Nvidia haya decidido basar su trabajo en un proyecto de código abierto como Llama-3.1 demuestra la importancia de la colaboración y la innovación compartida en el progreso tecnológico.