🔎

#inference

Todas las noticias etiquetadas como #inference en Pulso. Reescritas con asistencia de IA a partir de fuentes públicas.

Modal Auto Endpoints: Infección optimizada que tú posees

★ Destacada · Dev hace 16 h

Modal Auto Endpoints: Infección optimizada que tú posees

L1: Modal Auto Endpoints ofrece inferencia personalizada.

Show HN: MinLlama – Inferencia de Llama en ~100 líneas de NumPy

Dev vía github.com

Show HN: MinLlama – Inferencia de Llama en ~100 líneas de NumPy

Se construyó minLlama para una implementación de Llama fácil de entender y hackear para investigación sobre compresión de caché KV

hace 1 d · 2 min Leer →

La inflexión de la inferencia

IA vía latent.space

La inflexión de la inferencia

La era de la inferencia crece

hace 54 d · 2 min Leer →