Cerebras Systems desafía a Nvidia con el lanzamiento del servicio de inferencia de IA más rápido del mundo
Cerebras Systems, una startup ambiciosa en el ámbito de la computación de inteligencia artificial, ha lanzado el que afirma ser el servicio de inferencia de IA más rápido del mundo, en un desafío directo a Nvidia.
Este servicio, disponible en la nube, promete revolucionar el campo con velocidades comparables a la llegada de internet de banda ancha.
La inferencia de IA, esencial para la predicción y solución de tareas en tiempo real, ha experimentado un crecimiento explosivo en la nube, representando el 40% de todas las cargas de trabajo de IA. Sin embargo, los servicios actuales no parecen satisfacer todas las necesidades, lo que ha llevado a Cerebras a desarrollar una solución más rápida y rentable.
Equipado con su innovador procesador WSE-3, Cerebras ofrece un servicio de inferencia hasta 20 veces más rápido que las alternativas basadas en GPUs de Nvidia, con un costo mucho más competitivo. El WSE-3, un chip con más de 900,000 núcleos de computación y 44 GB de memoria, promete una velocidad máxima de 125 petaflops, abordando los principales desafíos técnicos de la IA generativa, como la necesidad de mayor ancho de banda de memoria.
El servicio de Cerebras es ideal para aplicaciones de IA agentica que requieren constante interacción con modelos subyacentes, como los desarrollados por empresas líderes en inteligencia artificial. Además, ofrece tres niveles de acceso, desde una opción gratuita hasta una empresarial, lo que lo hace accesible para desarrolladores y grandes organizaciones.
Con alianzas estratégicas y la compatibilidad con API de OpenAI, Cerebras parece estar en una posición ideal para captar la atención de los desarrolladores de IA y de grandes empresas tecnológicas, posicionándose como un competidor formidable frente a Nvidia en el mercado de inferencia de IA.
Fuente: SiliconANGLE