La IA no vive solo en GPUs: por qué las FPGA vuelven a importar

Cuando se habla de inteligencia artificial, casi siempre aparecen las mismas imágenes: grandes centros de datos, tarjetas gráficas, modelos gigantes y una carrera por conseguir más potencia de cálculo. Las GPUs se han convertido en uno de los símbolos tecnológicos de la IA moderna, y con razón. Han sido fundamentales para entrenar y ejecutar muchos de los modelos que hoy están transformando la forma en que trabajamos con texto, imagen, vídeo, visión artificial y análisis de datos.

Pero esa no es toda la historia.

La inteligencia artificial no vive únicamente en grandes servidores. También empieza a vivir en cámaras industriales, robots, sensores, sistemas embebidos, equipos de automatización, dispositivos de borde, laboratorios remotos y sistemas que interactúan con el mundo físico. En esos escenarios, la pregunta ya no es solo cuánta potencia de cálculo tenemos disponible. La pregunta es más amplia: dónde se ejecuta la IA, con qué latencia, con qué consumo, con qué interfaces, con qué nivel de control, con qué mantenimiento y con qué capacidad de validación.

Ahí es donde las FPGA vuelven a importar.

No porque sustituyan a las GPUs. No porque sean una solución mágica. No porque todo sistema de IA deba implementarse sobre hardware reconfigurable. Importan porque nos recuerdan una idea esencial en ingeniería: la IA aplicada no es solo un modelo. Es una arquitectura completa.

El relato dominante: IA, GPUs y potencia bruta

Durante los últimos años, buena parte de la conversación pública sobre inteligencia artificial ha estado dominada por los modelos generativos y el aprendizaje profundo a gran escala. En ese contexto, las GPUs tienen un papel central. Su arquitectura está muy bien adaptada a operaciones paralelas, cálculo matricial y procesamiento masivo de datos, lo que las convierte en una herramienta clave para entrenar y desplegar muchos modelos de IA.

Es comprensible, por tanto, que el imaginario colectivo haya asociado IA con GPU.

Sin embargo, desde una perspectiva de ingeniería de sistemas, esa asociación puede ser incompleta. Una cosa es entrenar un gran modelo en un centro de datos y otra muy distinta es integrar una función inteligente en un sistema físico que debe responder en tiempo real, comunicarse con sensores y actuadores, consumir poca energía, mantenerse durante años y poder ser validado de forma rigurosa.

En el mundo industrial, embebido y de automatización, la potencia bruta no siempre es el criterio dominante. A veces importa más la latencia. Otras veces, la eficiencia energética. En otros casos, la integración con interfaces específicas. Y en sistemas de larga vida, también pesan la mantenibilidad, la trazabilidad, la obsolescencia y la capacidad de evolución.

Por eso la pregunta técnica no debería ser “¿GPU o FPGA?”. Esa pregunta es demasiado simplificadora.

La pregunta correcta es: ¿qué arquitectura necesita este sistema?

Qué es una FPGA y por qué tiene sentido hablar de ella en IA

Una FPGA, siglas de Field-Programmable Gate Array, es un dispositivo lógico reconfigurable. A diferencia de una CPU, que ejecuta instrucciones de forma secuencial, o una GPU, que ejecuta muchas operaciones en paralelo sobre una arquitectura ya definida, una FPGA permite configurar hardware específico para una tarea concreta.

Dicho de forma sencilla: en una CPU o una GPU adaptamos el software al procesador; en una FPGA podemos adaptar parte del hardware al problema.

Esto tiene implicaciones importantes. Una FPGA permite construir caminos de datos específicos, pipelines de procesamiento, bloques de aceleración, interfaces personalizadas, lógica de control y arquitecturas optimizadas para flujos concretos de información. En aplicaciones de IA, esto puede ser especialmente relevante cuando no hablamos de entrenar modelos gigantes, sino de ejecutar inferencia cerca del sensor, procesar señales, analizar imágenes en tiempo real o integrar inteligencia en dispositivos embebidos.

La FPGA no compite con la GPU en todos los terrenos. No es lo mismo entrenar un modelo de lenguaje de gran escala que ejecutar una red neuronal optimizada en un equipo de visión industrial. Tampoco es lo mismo hacer experimentación rápida en software que diseñar una arquitectura embebida que debe funcionar durante años en un entorno controlado.

El valor de la FPGA aparece cuando las restricciones del sistema justifican su complejidad.

La IA en el borde: cuando el centro de datos no basta

Uno de los motivos por los que las FPGA vuelven a estar en la conversación es el crecimiento del edge AI, o inteligencia artificial en el borde. Este concepto hace referencia a la ejecución de algoritmos de IA cerca del punto donde se generan los datos: sensores, cámaras, máquinas, vehículos, robots, dispositivos industriales o sistemas embebidos.

Procesar en el borde puede tener varias ventajas.

La primera es reducir la latencia. Si una cámara industrial necesita detectar un defecto en una pieza y activar una respuesta inmediata, enviar los datos a la nube, esperar el procesamiento y recibir una respuesta puede no ser aceptable.

La segunda es reducir dependencia de conectividad. No todos los sistemas industriales pueden asumir conexión permanente, estable y segura con infraestructuras externas.

La tercera es mejorar privacidad y control del dato. En algunos casos, los datos no deben salir del entorno donde se generan.

La cuarta es reducir carga de comunicación. En lugar de enviar todos los datos brutos, el sistema puede procesar localmente y transmitir solo eventos, resultados o información ya filtrada.

En este contexto, las FPGA pueden tener sentido porque permiten procesar información en tiempo real, con pipelines específicos y con integración directa con interfaces físicas. No siempre serán la mejor opción, pero sí forman parte del conjunto de arquitecturas que un ingeniero debe considerar.

Latencia, determinismo y consumo: tres variables que cambian la decisión

Cuando hablamos de IA de forma general, solemos fijarnos en métricas como precisión, tamaño del modelo, número de parámetros o velocidad de inferencia. Son métricas importantes, pero no suficientes.

En ingeniería real aparecen otras variables.

La primera es la latencia. No solo importa cuánto tarda un sistema de media, sino cuánto tarda en el peor caso relevante. En una aplicación conectada al mundo físico, una respuesta tardía puede ser equivalente a una respuesta incorrecta.

La segunda es el determinismo. En sistemas industriales y embebidos, muchas veces interesa que el comportamiento temporal sea predecible. Una arquitectura que ofrece mucho rendimiento promedio, pero gran variabilidad temporal, puede no ser adecuada para ciertos escenarios.

La tercera es el consumo energético. En dispositivos de borde, sistemas compactos o arquitecturas distribuidas, el consumo no es un detalle secundario. Condiciona alimentación, disipación térmica, tamaño, coste, fiabilidad y mantenimiento.

Las FPGA pueden ofrecer ventajas en estos tres aspectos cuando el diseño está bien planteado: procesamiento en pipeline, paralelismo específico, lógica dedicada y reducción de operaciones innecesarias. Pero esto no ocurre automáticamente. Requiere diseño, verificación, optimización y conocimiento del problema.

Ejemplo conceptual: una cámara inteligente en una línea industrial

Imaginemos una línea de producción donde una cámara debe inspeccionar piezas en movimiento. El sistema tiene que capturar imágenes, preprocesarlas, detectar defectos y enviar una señal al sistema de control.

Podríamos resolverlo de varias formas.

Una CPU puede ser suficiente si el ritmo de producción es bajo, el algoritmo es sencillo y la latencia no es crítica.

Una GPU puede ser adecuada si necesitamos ejecutar modelos de visión más pesados y tenemos margen de consumo, espacio y refrigeración.

Una solución en la nube puede tener sentido si la aplicación no requiere respuesta inmediata y la conectividad está garantizada.

Una FPGA puede ser interesante si necesitamos adquirir datos directamente, procesar en pipeline, reducir latencia, integrar interfaces específicas y mantener control temporal sobre el flujo de información.

La clave no está en decir que una opción es siempre mejor que otra. La clave está en entender los requisitos.

En ingeniería, elegir hardware por moda suele ser una mala estrategia. La arquitectura debe salir del problema, no del titular tecnológico.

FPGA, GPU, CPU y NPU: no es una guerra, es una arquitectura heterogénea

El futuro de la IA aplicada no será una única arquitectura ganadora. Será una combinación de tecnologías.

Las GPUs seguirán siendo esenciales para entrenamiento, inferencia de alto rendimiento y cargas de trabajo masivas.

Las CPUs seguirán siendo necesarias para coordinación, lógica general, control de aplicación y flexibilidad software.

Las NPU y aceleradores específicos tendrán cada vez más presencia en dispositivos móviles, sistemas embebidos y aplicaciones de inferencia optimizada.

Las FPGA mantendrán su espacio allí donde la reconfiguración, la baja latencia, el procesamiento en pipeline, la integración con interfaces y el control temporal aporten valor diferencial.

Por eso conviene pensar en arquitecturas heterogéneas. No se trata de preguntar qué tecnología “gana”, sino qué combinación permite cumplir los requisitos del sistema con suficiente robustez, coste razonable y capacidad de evolución.

Esta forma de pensar es especialmente importante en automatización industrial, robótica, sistemas embebidos, edge AI, laboratorios remotos, instrumentación, visión artificial, control y sistemas de ciclo de vida largo.

La parte menos visible: validación y ciclo de vida

Hay otro punto que suele quedar fuera de la conversación sobre IA: la validación.

En una demo, basta con que algo funcione una vez de forma convincente. En un sistema real, eso no es suficiente. Hay que saber bajo qué condiciones funciona, bajo cuáles falla, cómo se prueba, cómo se actualiza, cómo se diagnostica y cómo se mantiene.

La IA aplicada a ingeniería necesita trazabilidad entre requisitos, datos, modelo, arquitectura de ejecución, interfaces y pruebas. Si cambiamos el modelo, puede cambiar el comportamiento del sistema. Si cambiamos el hardware, puede cambiar la latencia. Si cambiamos el flujo de datos, puede cambiar la validez de los resultados. Si cambiamos una interfaz, pueden aparecer riesgos no previstos.

Aquí las FPGA introducen oportunidades, pero también complejidad. Diseñar hardware reconfigurable no es trivial. Requiere metodología, simulación, verificación, análisis temporal, gestión de recursos y pruebas progresivas. Una FPGA mal diseñada puede ser tan problemática como cualquier otra solución mal integrada.

Por eso su valor no está solo en acelerar IA. Su valor aparece cuando forma parte de una arquitectura validable.

El riesgo del hype: ni todo es GPU, ni todo debe ser FPGA

Conviene cerrar una puerta al entusiasmo fácil.

Las FPGA no son la respuesta universal para la inteligencia artificial. En muchos proyectos, una CPU será suficiente. En otros, una GPU será la opción más razonable. En otros, un microcontrolador, una NPU, un SoC comercial o una arquitectura en la nube serán mejores alternativas.

Además, las FPGA tienen barreras: complejidad de diseño, curva de aprendizaje, herramientas específicas, tiempos de desarrollo, necesidad de perfiles especializados y dificultad para iterar con la misma rapidez que en entornos puramente software.

Por eso, cuando alguien afirma que “las FPGA son el futuro de la IA”, conviene matizar.

Sería más riguroso decir: las FPGA vuelven a ser relevantes en ciertos escenarios de IA aplicada donde importan la latencia, la eficiencia, la integración con interfaces, el procesamiento local y la adaptación de la arquitectura al problema.

Ese matiz es importante. Es la diferencia entre hacer marketing tecnológico y hacer ingeniería.

Conclusión: la IA necesita arquitectura, no solo modelos

La IA no vive solo en GPUs porque la IA real no vive solo en centros de datos. Vive también en sensores, máquinas, robots, cámaras, sistemas embebidos, dispositivos industriales, laboratorios y arquitecturas distribuidas.

Las GPUs seguirán siendo fundamentales. Pero no son la única pieza del mapa. Las FPGA vuelven a importar porque obligan a mirar la IA desde una perspectiva más completa: hardware, software, interfaces, latencia, consumo, validación, mantenimiento y ciclo de vida.

El reto no es elegir una tecnología de moda. El reto es diseñar sistemas inteligentes que puedan integrarse, probarse y mantenerse en entornos reales.

Quizá el futuro de la IA aplicada no dependa solo de tener modelos más grandes, sino de saber colocar la inteligencia adecuada en el punto correcto del sistema.

Y esa sigue siendo una tarea profundamente ligada a la ingeniería.

Pregunta final

¿Estamos hablando demasiado de modelos de IA y demasiado poco de la arquitectura donde esos modelos tienen que vivir?