Volver
Kevin Riedl

11 min de lectura · 5 Jul 2026

Siguiente

Cifrado Totalmente Homomórfico en 2026: Qué Se Lanza y Qué Sigue Siendo Hype

El cifrado totalmente homomórfico tiene la reputación más extraña de la criptografía aplicada: a la vez "el santo grial" y "siempre a diez años vista". Ambas reputaciones son ya erróneas. El FHE corre hoy en cientos de millones de iPhones, comprueba contraseñas en Microsoft Edge y liquida transacciones cifradas en Ethereum. También sigue siendo de tres a cuatro órdenes de magnitud más lento que el texto plano, lo que descarta la mayor parte de lo que la gente imagina hacer con él. Este post traza la línea con precisión: qué hace el FHE en producción en 2026, cuáles son las cifras honestas, y qué afirmaciones descontar. La guía pragmática que lo acompaña cubre cuándo FHE es siquiera la herramienta correcta.

Perspectiva de ingeniería, no un pitch de proveedor. Cuando una cifra viene de un vendor o es una proyección de roadmap en lugar de un resultado ya lanzado, lo etiquetamos. Los puntos de referencia vienen del trabajo de Wavect en tecnología de frontera e IA.

¿Sopesando FHE frente a un TEE para tu producto?

 Reserva Consultoría Gratuita

¿Qué es el FHE, y por qué se volvió interesante de repente?

El FHE permite a un servidor computar sobre datos cifrados sin descifrarlos nunca. El cliente cifra el input, el servidor ejecuta la computación a ciegas, y solo el cliente puede descifrar el resultado. El servidor no aprende nada, ni siquiera la respuesta. Es una promesa categóricamente más fuerte que el cifrado en reposo, y más fuerte que un entorno de ejecución confiable, porque no hay ningún fabricante de hardware en el modelo de confianza.

Se volvió interesante por dos razones. Primera, el rendimiento: una operación de bootstrapping de TFHE, la unidad básica de computación cifrada ilimitada, cayó de decenas de milisegundos en una CPU a menos de un milisegundo en una NVIDIA H100. Segunda, la credibilidad: Apple lo lanzó a escala de consumo, y Zama se convirtió en el primer unicornio del campo con una Serie B de 57 millones de dólares a una valoración por encima de 1.000 millones de dólares en junio de 2025 (Zama). El dinero y los despliegues en producción cambiaron la conversación.

¿Qué esquema para qué trabajo?

"FHE" es una familia, y elegir el miembro equivocado es un primer error común:

EsquemaModelo de datosFortalezaUso típico
TFHE (CGGI)Bits y enteros pequeñosBootstrapping programable rápido, lógica arbitraria vía tablas de lookupComparaciones, lógica con ramas, smart contracts cifrados
CKKSNúmeros reales aproximados, empaquetados SIMDEl mejor throughput amortizado para workloads numéricosInferencia de machine learning, estadística, analítica
BGV / BFVEnteros exactos, empaquetados SIMDAritmética exacta a escalaLookups privados (PIR), analítica exacta, conteo

Regla rápida: la lógica y las comparaciones quieren TFHE, el ML quiere CKKS, los lookups exactos quieren BFV. Una buena introducción a los esquemas es el "Beginner's Textbook for Fully Homomorphic Encryption" de 2025 (arXiv 2503.05136). Los stacks modernos cambian cada vez más de esquema a mitad de computación, que es exactamente para lo que existen proyectos de compilador como HEIR de Google.

¿Qué se lanza de verdad en producción?

La lista de producción es corta, real e instructiva:

  • Apple Live Caller ID Lookup (iOS 18+). Tu iPhone comprueba una llamada desconocida contra la base de datos de un proveedor de identificación de llamadas sin revelar el número de teléfono al servidor, usando private information retrieval basado en BFV. Apple liberó el stack como swift-homomorphic-encryption (Swift.org, 2024). Junto con Enhanced Visual Search abajo, es probablemente la mayor huella de FHE de consumo que existe.
  • Apple Enhanced Visual Search. Fotos empareja los monumentos de tus imágenes contra un índice del servidor usando FHE más privacidad diferencial. Criptográficamente excelente, y aun así un caso de estudio de consentimiento: Apple lo activó por defecto sin preguntar, y se llevó una reacción pública justificada en enero de 2025 (The Register). La tecnología de privacidad no excusa saltarse el opt-in.
  • Microsoft Edge Password Monitor. Comprueba tus credenciales contra corpus de filtraciones de forma homomórfica, de modo que Microsoft nunca ve la contraseña. Misma forma arquitectónica que el despliegue de Apple: un lookup privado de conjuntos.
  • Protocolo Zama en Ethereum. En mainnet desde diciembre de 2025, habilitando balances de tokens cifrados y transferencias confidenciales en chains públicas vía TFHE (docs de Zama). El throughput está hoy en decenas de transacciones por segundo; el roadmap publicado hacia miles vía FPGAs y ASICs es una proyección, no un resultado ya lanzado.
  • Colaboración de datos empresarial. Duality Technologies ejecuta analítica homomórfica y federada con socios sanitarios, incluido Dana-Farber, combinando típicamente HE con federated learning en lugar de correr todo bajo FHE.

Fíjate en lo que todo despliegue de consumo tiene en común: es un lookup privado contra un dataset del servidor, conocido en la literatura como private information retrieval. Consulta pequeña, computación acotada, latencia tolerante a lo asíncrono. Ese es el patrón que se lanza. Nadie está corriendo su backend bajo FHE, incluidas las empresas con más dinero del planeta.

Kevin Riedl

"Cada despliegue de FHE que de verdad se lanzó es un lookup privado estrecho. Los equipos que fracasan son los que intentan cifrar el backend entero."

¿Cómo de lento es el FHE, en realidad?

Las cifras honestas, a mediados de 2026:

  • Sobrecoste general: aproximadamente de 1.000x a 10.000x frente a la misma computación en texto plano, según esquema y workload. Las sumas son baratas, las multiplicaciones y comparaciones son caras.
  • Bootstrapping de TFHE: milisegundos de un solo dígito en un núcleo de CPU moderno, menos de un milisegundo en una GPU de clase H100, con reportes de alrededor de 189.000 bootstraps por segundo en un nodo de 8 GPUs (cifra de vendor).
  • Inferencia de ML con modelos pequeños: regresión logística, árboles de decisión y redes neuronales pequeñas corren en segundos bajo CKKS o vía Concrete ML de Zama, que convierte modelos cuantizados y mantiene la precisión a pocos puntos del texto plano para cuantización de 4 bits (Hugging Face / Zama).
  • PIR a escala: práctico hoy. Apple responde lookups cifrados para una gran fracción de los iPhones del mundo con latencia y coste de servidor aceptables.

Planifica con la regla del 1.000x: si la computación en texto plano tarda un microsegundo, la versión cifrada tarda un milisegundo y probablemente es viable. Si la versión en texto plano tarda un segundo, la versión cifrada tarda más de 15 minutos y no es un producto.

¿Puedes correr un LLM bajo FHE?

No, no de forma interactiva, y esta sección existe porque las cifras que más se citan para demostrar lo contrario están equivocadas de una forma instructiva. La cifra ampliamente difundida de "8,2 minutos por token para GPT-2 con 25,3 GB de comunicación" viene de investigación de computación segura entre dos partes, no de FHE (arXiv 2410.13060). Los gigabytes de tráfico de red son la pista delatora: MPC quema ancho de banda entre las partes, mientras que FHE quema cómputo local casi sin comunicación. Confundir los dos es el error técnico más común en el contenido sobre IA privada.

El cuadro real del FHE: la investigación acelerada por GPU ejecuta un forward pass de clase GPT-2 aproximadamente 200x más rápido que las bases de CPU (ICML 2025), lo que todavía lo deja lejos del chat interactivo. Los esquemas híbridos (correr las capas de atención en claro y las capas sensibles cifradas) intercambian privacidad por velocidad y siguen siendo investigación. Lo que funciona en términos de producción es la inferencia de modelos pequeños sobre datos genuinamente sensibles: scoring crediticio, precribado médico, señales de fraude, donde unos segundos de latencia sobre un modelo acotado son aceptables. Si necesitas inferencia privada de modelos frontier hoy, la respuesta pragmática es una GPU confidencial (TEE de clase NVIDIA H100), y comparamos esos modelos de confianza en el post del framework de decisión.

¿Arreglará el hardware el sobrecoste?

Parcialmente, en un calendario creíble:

  • Disponible hoy: GPUs. Las cifras de bootstrap por debajo del milisegundo de arriba son reales y reproducibles hoy, mientras que la mainnet de Zama todavía ejecuta sus coprocesadores en CPUs a decenas de transacciones por segundo, con la migración a GPU en el roadmap de 2026. La aceleración por GPU aporta de uno a dos órdenes de magnitud y es la única aceleración que puedes comprar ahora mismo.
  • 2027 en adelante: ASICs y exóticos. El programa DPRIVE de DARPA sembró una ola de silicio dedicado a FHE (Niobium, el linaje TREBUCHET de Duality, el trabajo HERACLES de Intel), y las startups levantaron fuerte: Fabric Cryptography cerró una Serie A de 33 millones de dólares para una VPU criptográfica, Optalysys levantó unos 30 millones de dólares para FHE fotónico a principios de 2026, Cornami construye aceleradores FHE many-core. Las aceleraciones de 5.000x a 17.000x que se citan con frecuencia de esta generación son resultados de simulación y proyecciones, no silicio ya entregado. Diseña para GPUs ahora; trata los calendarios de ASIC como potencial al alza, no como plan.

¿Con qué librería deberías empezar?

LibreríaFoco de esquemaLenguajeElígela cuando
TFHE-rs / Concrete (Zama)TFHERust, PythonLógica y enteros cifrados; el estándar de facto de TFHE con la comunidad más grande
Concrete ML (Zama)TFHEPython, API estilo scikit-learnInferencia de ML privada en modelos pequeños sin experiencia en criptografía
OpenFHE (Duality y consorcio académico)Todos los esquemas principalesC++Workloads CKKS/BGV, flexibilidad de grado investigación, analítica empresarial
swift-homomorphic-encryption (Apple)BFVSwiftLookups privados estilo PIR, especialmente en ecosistemas Apple
Lattigo (Tune Insight)CKKS, BGV, multiparteGoEquipos de Go y montajes de HE multiparte
Microsoft SEALBFV, CKKSC++Integraciones existentes; el mantenimiento se retomó en 2026 tras una etapa tranquila, pero el impulso del ecosistema está con TFHE-rs y OpenFHE
HEIR (Google)Compilador entre esquemasBasado en MLIRCompilar código de alto nivel a backends FHE; la capa de abstracción a largo plazo más probable (heir.dev)

Elecciones por defecto: TFHE-rs para lógica, Concrete ML para ML privado pequeño, OpenFHE para analítica CKKS, la librería de Apple para PIR. Todas son open source; el coste está en la selección de parámetros, el presupuesto de ruido y la ingeniería de rendimiento, que es donde un partner con experiencia se gana su tarifa.

Preguntas frecuentes

¿Es práctico el cifrado totalmente homomórfico en 2026?
Sí, para workloads estrechos: lookups privados (el patrón de Apple y Microsoft), inferencia de ML con modelos pequeños, y lógica cifrada a decenas de transacciones por segundo. No, para computación de propósito general o interactiva, donde el sobrecoste de 1.000x a 10.000x todavía lo descarta. La decisión de alcance es todo el juego.
¿Cuál es la diferencia entre FHE y un TEE como Intel TDX o una GPU confidencial?
Un TEE ejecuta computación en texto plano dentro de aislamiento por hardware a velocidad casi nativa, pero confías en el fabricante del chip y en la ausencia de ataques de canal lateral. FHE elimina por completo esa confianza en el hardware a un coste de tres a cuatro órdenes de magnitud en rendimiento. La mayoría de los productos que necesitan cómputo confidencial a escala eligen hoy un TEE; FHE gana donde ninguna raíz de confianza en hardware es aceptable.
¿Puede FHE correr modelos estilo ChatGPT de forma privada?
No de forma interactiva en 2026. La investigación acelerada por GPU ha acelerado drásticamente la inferencia cifrada de clase GPT-2, pero la inferencia cifrada a escala frontier sigue lejos del tiempo real. Las cifras de minutos por token con gigabytes de tráfico que suelen citarse describen en realidad sistemas MPC, no FHE. Para inferencia privada de LLM hoy, las GPUs confidenciales son la opción pragmática.
¿Qué es TFHE frente a CKKS?
TFHE computa sobre bits y enteros pequeños con bootstrapping rápido, lo que lo hace ideal para comparaciones, ramas y lógica exacta. CKKS computa sobre números reales aproximados con empaquetado SIMD intensivo, lo que lo convierte en el esquema de elección para machine learning y estadística. Las aplicaciones serias suelen combinar ambos vía cambio de esquema.
¿Quiénes son los principales vendors y librerías de FHE?
Zama (TFHE-rs, Concrete, Concrete ML y el Protocolo Zama en Ethereum) lidera el campo comercial y se convirtió en su primer unicornio en 2025. OpenFHE es la librería open source de referencia para CKKS y BGV, Apple liberó su stack BFV, Google desarrolla el compilador HEIR, y Duality y Tune Insight sirven analítica empresarial.

Reflexiones finales

El FHE en 2026 no es ni grial ni vaporware. Es una herramienta especialista con un patrón de producción probado: un cliente cifra una consulta pequeña, un servidor computa a ciegas, nadie salvo el usuario ve jamás los datos. Apple, Microsoft y Zama lanzan exactamente esa forma, y el tooling para construirla (TFHE-rs, Concrete ML, OpenFHE, la librería Swift de Apple) es open source y usable por equipos de ingeniería fuertes hoy.

La disciplina está en lo que te niegas a construir: cualquier cosa interactiva, cualquier cosa del tamaño de un modelo frontier, cualquier cosa donde una base de datos más control de acceso ya satisface el modelo de confianza. Limita FHE a la única computación que debe permanecer ciega, córrela en GPUs, trata los roadmaps de ASIC como potencial al alza, y deja que un TEE cargue con los workloads que FHE no puede. Así es como metes la garantía de privacidad más fuerte de la criptografía en un producto sin que el producto muera de latencia.

¿Quieres un chequeo honesto de viabilidad de FHE en tu stack?

 Reserva Consultoría Gratuita
Volver
Kevin Riedl

11 min de lectura · 5 Jul 2026

Siguiente