Los chips IBM Telum II (izquierda) y Spyre (derecha) son el resultado de los esfuerzos de IBM Research por construir hardware centrado en IA.
Hoy, IBM anunció el lanzamiento de z17, la última versión del mainframe que impulsa a las empresas y maneja el 70% de las transacciones financieras del mundo.1Los cerebros de los aceleradores de IA del nuevo sistema fueron concebidos y desarrollados conjuntamente en IBM Research: el núcleo acelerador de IA integrado del procesador Telum II y el acelerador Spyre, disponible en el cuarto trimestre de 2025.
Con estos potentes componentes, z17 abrirá el camino a una era de aplicaciones de IA para empresas. En sectores donde los datos deben mantenerse seguros, pero accesibles con la menor latencia posible, z17 con Spyre permitirá a las empresas ejecutar modelos de IA generativos e IA de agencia local.
Para z17, el acelerador Spyre de 32 núcleos estará disponible como tarjeta PCIe opcional, y se podrán añadir tarjetas adicionales según sea necesario. Spyre y Telum II se basan en el éxito de Telum , que impulsa el sistema z16 e incorpora un acelerador de IA integrado, pionero en la industria. Este acelerador sentó las bases de Spyre , un acelerador de IA que utiliza computación de baja precisión y una arquitectura centrada en IA para la inferencia de baja latencia.
Al diseñar estos potentes dispositivos, el equipo de investigación de IBM, responsable de los aceleradores en chip Telum II y Spyre, ayudó a superar un importante desafío: llevar el poder de la IA al punto de transacción para los clientes de infraestructura de IBM, a una velocidad y escala sin precedentes. Mientras tanto, la IA sigue evolucionando. Independientemente de la relevancia de los modelos específicos de IA, diseñaron algo para gestionar las cargas de trabajo del futuro, no solo las de hoy.
“Siempre es como lanzar un dardo, pero creo que aquí tenemos los mejores lanzadores de dardos que podamos imaginar”, afirma Leland Chang, miembro principal del personal de investigación y gerente sénior en Diseño de Hardware de IA.
“Construimos un acelerador completo”, afirma Jeff Burns, director del Centro de Hardware de IA de IBM Research . “Es un chip de sistema en chip, una tarjeta PCIe, un compilador, un entorno de ejecución y un controlador de dispositivo, etcétera”. Estas características, señala Burns, permiten que los científicos de datos puedan usar Spyre sin necesidad de realizar ninguna acción especial.
Telum II y Spyre logran sus capacidades de inferencia de IA mediante el codiseño de software y hardware, fruto de la colaboración entre los equipos de IBM y de las aportaciones directas de los clientes de IBM Z. z17 se basa en una completa pila de software, y el equilibrio perfecto entre la innovación de hardware y software fue fundamental para el desarrollo de Telum II y Spyre. «Con base en las prioridades y los objetivos, determinamos si una capa de software puede mejorarse para aprovechar al máximo las capacidades de cómputo del hardware», añade el distinguido científico investigador Viji Srinivasan.
Y los resultados hablan por sí solos. En las primeras pruebas , un prototipo de Spyre procesó más del triple de imágenes por segundo por vatio de electricidad consumido que las GPU de gama alta. Dadas las enormes proyecciones de energía requeridas para alimentar las cargas de trabajo de IA, el equipo supo que habían dado con una posible solución.
La IA requiere mucha más potencia de procesamiento que las aplicaciones cotidianas. IBM Research lleva casi una década trabajando arduamente en chips específicos para IA y lanzó el Centro de Hardware de IA de IBM Research en 2019 para centrarse en satisfacer las crecientes demandas energéticas de la IA con tecnología más eficiente.
Parte de esta estrategia de hardware de IA implica la computación de baja precisión , que puede mejorar considerablemente la eficiencia energética de los sistemas que ejecutan cálculos de IA. Antes incluso de que existiera el Centro de Hardware de IA, el camino hacia Spyre comenzó en 2015 con un informe técnico de dos páginas en IBM Research. Basándose en un breve informe de Burns y su grupo, su equipo obtuvo luz verde para investigar la viabilidad de la computación aproximada para el aprendizaje profundo.
Su hipótesis era que diseñar hardware de baja precisión desde cero produciría un mayor rendimiento energético para el aprendizaje profundo que intentar hacer cálculos aproximados en las GPU o CPU disponibles.
Las GPU, ideales para ejecutar múltiples procesos en paralelo, han sido populares para ejecutar cargas de trabajo de IA. Pero para Burns y sus colegas, era evidente que se necesitaba algo más. Esta idea ya se había demostrado con el procesamiento de gráficos en GPU, que son menos generales que las CPU, pero más generales que las necesidades de la IA. Entonces, ¿por qué no un núcleo de cómputo diseñado específicamente para el aprendizaje profundo?
Esta idea encajaba con lo que los clientes de IBM Infrastructure buscaban de IBM Z: inferencia de IA, seguridad mejorada y funciones de virtualización. El equipo optimizó un chip con estos aspectos en mente. Los investigadores lo denominaron AIU (unidad de inteligencia artificial). Después de que Burns y su equipo desarrollaran su primera versión funcional, se involucraron otros miembros del equipo de IBM Infrastructure, incluyendo muchos del área de software, para ayudar a desarrollar el paquete completo.
Desde la fundación del Centro de Hardware de IA en 2019, era evidente que la situación cambiaba rápidamente, afirma el director del programa, John Rozen. «Vimos un cambio en las cargas de trabajo de computación, incluso antes de ChatGPT», recuerda. «Y aunque un sistema en chip no era lo que pretendíamos inicialmente, escuchamos a nuestros socios y dimos frutos con el Acelerador Spyre y sus 32 núcleos».
El cronograma es un gran desafío en el diseño de chips de IA, ya que las cargas de trabajo cambian rápidamente, pero los chips tardan años en desarrollarse. Por esta razón, Watsonx ha servido como guía en medio de los cambios constantes de la IA, afirma Chang. Cuando el equipo diseñaba Spyre para optimizar un punto de referencia de inferencia de IA específico, en tan solo dos meses ese objetivo cambiaba por completo. «Esta ha sido la mayor montaña rusa de mi carrera», afirma Chang.
La Hoja de Ruta de IA del equipo Watsonx , desarrollada años antes, brindó una guía esencial: en 2025, postuló que el hardware diseñado específicamente ayudaría a la IA generativa a escalar de nuevas maneras, potencialmente más allá de los transformadores. Y en 2026, predijo la eminencia de modelos robustos de razonamiento estratégico. El equipo de Infraestructura de IBM también ha sido invaluable porque conoce a la perfección las necesidades de sus clientes y sigue anticipándose a sus necesidades en el futuro.
El acelerador Spyre está diseñado para gestionar las nuevas cargas de trabajo de IA que los clientes z17 incorporarán a la plataforma. Está optimizado para IA generativa y agente, por ejemplo, en lugar de modelos en los que el campo está perdiendo terreno, como los modelos de clasificación.
Y si bien los modelos de IA han aumentado de tamaño durante la última década, el mundo también avanza hacia modelos más pequeños y específicos para su propósito. Al mismo tiempo, la industria está experimentando un aumento en la combinación de modelos expertos y modelos de espacio de estados, cuyos usos ideales y capacidades completas aún se están explorando. Todos estos avances se reflejan en la hoja de ruta que guió el desarrollo de Spyre, que a su vez incorpora estas capacidades. Los mainframes actuales son esenciales para sectores como los servicios financieros y la salud. El conjunto de casos de uso de IA está en constante expansión, con más de 250 para IBM Z, incluyendo la detección avanzada de fraude financiero, la prevención del lavado de dinero y la calificación de riesgo crediticio, por nombrar solo algunos.
En el caso de Spyre, Rozen reconoce el mérito de equipos como Red Hat y Watsonx por ayudar a desarrollar el acelerador hasta su estado actual, el nuevo IBM z17. “No sabíamos que lo incorporarían a nuestro producto”, afirma. “Simplemente sabíamos que era lo correcto”.
Las declaraciones sobre la dirección e intenciones futuras de IBM están sujetas a cambios o retiro sin previo aviso y representan únicamente metas y objetivos.
*Tomado de IBM