Arison: convertir Grindr en una 'nativa de IA', imponer IA a los empleados y enfrentarse a la oposición
La empresa china Meituan ha lanzado LongCat-2.0, un modelo de lenguaje de 1,6 billones de parámetros. Este modelo ha sido entrenado en un cluster de 50.000 procesadores chinos.
Meituan es una empresa de entrega de comida en China. LongCat-2.0 es un modelo de lenguaje grande que ha sido entrenado desde cero en un cluster de procesadores chinos. El modelo tiene una arquitectura de atención dispersa y puede procesar tokens de contexto de hasta 1 millón.
“El lanzamiento de LongCat-2.0 es significativo porque es el primer modelo de lenguaje de este tamaño que ha sido entrenado en procesadores chinos”
El lanzamiento de LongCat-2.0 es significativo porque es el primer modelo de lenguaje de este tamaño que ha sido entrenado en procesadores chinos. Esto sugiere que China puede desarrollar modelos de lenguaje avanzados sin depender de tecnología extranjera. El modelo ha sido abierto al público y está disponible para su descarga.
La capacidad de Meituan para desarrollar un modelo de lenguaje de este tamaño y complejidad es un logro técnico importante. LongCat-2.0 ha sido diseñado para ser utilizado en aplicaciones de codificación agente y ha demostrado un rendimiento cercano a la frontera en pruebas de benchmark. El modelo también ha sido utilizado en la plataforma de entrega de comida de Meituan, lo que sugiere que la empresa está explorando formas de utilizar la inteligencia artificial para mejorar sus servicios.