OpenAI y Broadcom anuncian chip para inferencia de modelos de lenguaje de gran escala
OpenAI y Broadcom han anunciado un nuevo chip llamado Jalapeño diseñado específicamente para la inferencia de modelos de lenguaje de gran escala en centros de datos. Este dispositivo, desarrollado durante nueve meses, es una respuesta a las necesidades actuales de los modelos de inteligencia artificial (IA).
El chip Jalapeño fue creado desde cero con el fin específico de mejorar la eficiencia energética y el rendimiento para la inferencia de modelos de lenguaje. Según OpenAI, los primeros tests muestran que este nuevo hardware ofrece un desempeño por vatios superior a lo que se considera actualmente como puntero en el mercado.
“Según OpenAI, los primeros tests muestran que este nuevo hardware ofrece un desempeño por vatios superior a lo que se considera actualmente como puntero en el mercado”
Broadcom asegura que Jalapeño es el resultado directo del trabajo conjunto con investigadores de OpenAI y está basado en las necesidades futuras de la empresa. Se espera que este chip sea una pieza clave para reducir la dependencia de empresas como Nvidia, ofreciendo posiblemente un mejor rendimiento gracias a la integración vertical.
Ambas compañías han anunciado planes para desplegar Jalapeño en centros de datos antes del final de 2023. Este esfuerzo forma parte de una estrategia más amplia que busca optimizar los recursos computacionales y mejorar el rendimiento de las aplicaciones basadas en IA.
El anuncio responde a la creciente demanda de potencia de cálculo para manejar modelos de lenguaje cada vez más grandes, un aspecto crucial en el desarrollo actual de sistemas de inteligencia artificial. Esta iniciativa busca abordar los desafíos relacionados con la eficiencia energética y la capacidad de procesamiento en entornos de centros de datos.
La importancia del proyecto radica en su potencial para mejorar significativamente la ejecución de modelos de lenguaje de gran escala, lo que puede tener implicaciones importantes tanto para el desarrollo futuro de IA como para la infraestructura subyacente necesaria para soportar estas aplicaciones.