Maia 200: El acelerador de IA diseñado para la inferencia

Por: Scott Guthrie – Vicepresidente ejecutivo, Nube + IA Hoy nos enorgullece presentar Maia 200, un innovador acelerador de inferencia diseñado para optimizar drásticamente la economía de la generación de tokens de IA. Maia 200 es una potencia de inferencia de IA: un acelerador basado en el proceso de 3 nm de TSMC con núcleos tensoriales FP8/FP4 nativos, un sistema de memoria rediseñado con 216 GB de HBM3e a 7 TB/s y 272 MB de SRAM en chip, además de motores de movimiento de datos que mantienen modelos masivos alimentados,…

Read More