Cifrado Totalmente Homomórfico en 2026: Qué Se Lanza y Qué Sigue Siendo Hype

Resumen

El FHE no es ni grial ni vaporware en 2026. Se lanza en producción allí donde el workload es un lookup privado estrecho: el Live Caller ID y el Enhanced Visual Search de Apple, el Password Monitor de Microsoft Edge, y la mainnet de transacciones cifradas de Zama en Ethereum a decenas de transacciones por segundo. El sobrecoste honesto sigue siendo de aproximadamente 1.000x a 10.000x frente al texto plano, así que cualquier cosa interactiva o del tamaño de un modelo frontier queda fuera de alcance; las cifras de minutos por token de LLM cifrado que tanto se citan vienen en realidad de investigación MPC, no de FHE. La elección de esquema es la primera decisión: TFHE para lógica y comparaciones, CKKS para ML y estadística, BFV para lookups exactos. La aceleración por GPU es real y ya se vende; Intel demostró silicio HERACLES en 2026, pero sigue siendo un prototipo de investigación. Empieza con TFHE-rs para lógica o la librería Swift de Apple para PIR, y mide Poulpy, Lattigo, SEAL, OpenFHE y opciones nativas de GPU como FIDESlib antes de elegir un stack CKKS. Las cifras son una foto de mediados de 2026; vuelve a comprobarlas antes de comprometerte.

El cifrado totalmente homomórfico tiene la reputación más extraña de la criptografía aplicada: a la vez "el santo grial" y "siempre a diez años vista". Ambas reputaciones son ya erróneas. El FHE corre hoy en cientos de millones de iPhones, comprueba contraseñas en Microsoft Edge y liquida transacciones cifradas en Ethereum. También sigue siendo de tres a cuatro órdenes de magnitud más lento que el texto plano, lo que descarta la mayor parte de lo que la gente imagina hacer con él. Este post traza la línea con precisión: qué hace el FHE en producción en 2026, cuáles son las cifras honestas, y qué afirmaciones descontar. La guía pragmática que lo acompaña cubre cuándo FHE es siquiera la herramienta correcta.

Perspectiva de ingeniería, no un pitch de proveedor. Cuando una cifra viene de un vendor o es una proyección de roadmap en lugar de un resultado ya lanzado, lo etiquetamos. Los puntos de referencia vienen del trabajo de Wavect en tecnología de frontera e IA.

¿Sopesando FHE frente a un TEE para tu producto?

Reserva Consultoría Gratuita

¿Qué es el FHE, y por qué se volvió interesante de repente?

El FHE permite a un servidor computar sobre datos cifrados sin descifrarlos nunca. El cliente cifra el input, el servidor ejecuta la computación a ciegas, y solo el cliente puede descifrar el resultado. El servidor no aprende nada, ni siquiera la respuesta. Es una promesa categóricamente más fuerte que el cifrado en reposo, y más fuerte que un entorno de ejecución confiable, porque no hay ningún fabricante de hardware en el modelo de confianza.

Se volvió interesante por dos razones. Primera, el rendimiento: una operación de bootstrapping de TFHE, la unidad básica de computación cifrada ilimitada, cayó de decenas de milisegundos en una CPU a menos de un milisegundo en una NVIDIA H100. Segunda, la credibilidad: Apple lo lanzó a escala de consumo, y Zama se convirtió en el primer unicornio del campo con una Serie B de 57 millones de dólares a una valoración por encima de 1.000 millones de dólares en junio de 2025 (Zama). El dinero y los despliegues en producción cambiaron la conversación.

¿Qué esquema para qué trabajo?

"FHE" es una familia, y elegir el miembro equivocado es un primer error común:

Esquema	Modelo de datos	Fortaleza	Uso típico
TFHE (CGGI)	Bits y enteros pequeños	Bootstrapping programable rápido, lógica arbitraria vía tablas de lookup	Comparaciones, lógica con ramas, smart contracts cifrados
CKKS	Números reales aproximados, empaquetados SIMD	El mejor throughput amortizado para workloads numéricos	Inferencia de machine learning, estadística, analítica
BGV / BFV	Enteros exactos, empaquetados SIMD	Aritmética exacta a escala	Lookups privados (PIR), analítica exacta, conteo

Regla rápida: la lógica y las comparaciones quieren TFHE, el ML quiere CKKS, los lookups exactos quieren BFV. Una buena introducción a los esquemas es el "Beginner's Textbook for Fully Homomorphic Encryption" de 2025 (arXiv 2503.05136). Los stacks modernos cambian cada vez más de esquema a mitad de computación, que es exactamente para lo que existen proyectos de compilador como HEIR de Google.

¿Qué se lanza de verdad en producción?

La lista de producción es corta, real e instructiva:

Apple Live Caller ID Lookup (iOS 18+). Tu iPhone comprueba una llamada desconocida contra la base de datos de un proveedor de identificación de llamadas sin revelar el número de teléfono al servidor, usando private information retrieval basado en BFV. Apple liberó el stack como swift-homomorphic-encryption (Swift.org, 2024). Junto con Enhanced Visual Search abajo, es probablemente la mayor huella de FHE de consumo que existe.
Apple Enhanced Visual Search. Fotos empareja los monumentos de tus imágenes contra un índice del servidor usando FHE más privacidad diferencial. Criptográficamente excelente, y aun así un caso de estudio de consentimiento: Apple lo activó por defecto sin preguntar, y se llevó una reacción pública justificada en enero de 2025 (The Register). La tecnología de privacidad no excusa saltarse el opt-in.
Microsoft Edge Password Monitor. Comprueba tus credenciales contra corpus de filtraciones de forma homomórfica, de modo que Microsoft nunca ve la contraseña. Misma forma arquitectónica que el despliegue de Apple: un lookup privado de conjuntos.
Protocolo Zama en Ethereum. En mainnet desde diciembre de 2025, habilitando balances de tokens cifrados y transferencias confidenciales en chains públicas vía TFHE (docs de Zama). El throughput está hoy en decenas de transacciones por segundo; el roadmap publicado hacia miles vía FPGAs y ASICs es una proyección, no un resultado ya lanzado.
Colaboración de datos empresarial. Duality Technologies ejecuta analítica homomórfica y federada con socios sanitarios, incluido Dana-Farber, combinando típicamente HE con federated learning en lugar de correr todo bajo FHE.

Fíjate en lo que todo despliegue de consumo tiene en común: es un lookup privado contra un dataset del servidor, conocido en la literatura como private information retrieval. Consulta pequeña, computación acotada, latencia tolerante a lo asíncrono. Ese es el patrón que se lanza. Nadie está corriendo su backend bajo FHE, incluidas las empresas con más dinero del planeta.

"Cada despliegue de FHE que de verdad se lanzó es un lookup privado estrecho. Los equipos que fracasan son los que intentan cifrar el backend entero."

¿Cómo de lento es el FHE, en realidad?

Las cifras honestas, a mediados de 2026:

Sobrecoste general: aproximadamente de 1.000x a 10.000x frente a la misma computación en texto plano, según esquema y workload. Las sumas son baratas, las multiplicaciones y comparaciones son caras.
Bootstrapping de TFHE: milisegundos de un solo dígito en un núcleo de CPU moderno, menos de un milisegundo en una GPU de clase H100, con reportes de alrededor de 189.000 bootstraps por segundo en un nodo de 8 GPUs (cifra de vendor).
Inferencia de ML con modelos pequeños: regresión logística, árboles de decisión y redes neuronales pequeñas corren en segundos bajo CKKS o vía Concrete ML de Zama, que convierte modelos cuantizados y mantiene la precisión a pocos puntos del texto plano para cuantización de 4 bits (Hugging Face / Zama).
PIR a escala: práctico hoy. Apple responde lookups cifrados para una gran fracción de los iPhones del mundo con latencia y coste de servidor aceptables.

Planifica con la regla del 1.000x: si la computación en texto plano tarda un microsegundo, la versión cifrada tarda un milisegundo y probablemente es viable. Si la versión en texto plano tarda un segundo, la versión cifrada tarda más de 15 minutos y no es un producto.

¿Puedes correr un LLM bajo FHE?

No, no de forma interactiva, y esta sección existe porque las cifras que más se citan para demostrar lo contrario están equivocadas de una forma instructiva. La cifra ampliamente difundida de "8,2 minutos por token para GPT-2 con 25,3 GB de comunicación" viene de investigación de computación segura entre dos partes, no de FHE (arXiv 2410.13060). Los gigabytes de tráfico de red son la pista delatora: MPC quema ancho de banda entre las partes, mientras que FHE quema cómputo local casi sin comunicación. Confundir los dos es el error técnico más común en el contenido sobre IA privada.

El cuadro real del FHE: la investigación acelerada por GPU ejecuta un forward pass de clase GPT-2 aproximadamente 200x más rápido que las bases de CPU (ICML 2025), lo que todavía lo deja lejos del chat interactivo. Los esquemas híbridos (correr las capas de atención en claro y las capas sensibles cifradas) intercambian privacidad por velocidad y siguen siendo investigación. Lo que funciona en términos de producción es la inferencia de modelos pequeños sobre datos genuinamente sensibles: scoring crediticio, precribado médico, señales de fraude, donde unos segundos de latencia sobre un modelo acotado son aceptables. Si necesitas inferencia privada de modelos frontier hoy, la respuesta pragmática es una GPU confidencial (TEE de clase NVIDIA H100), y comparamos esos modelos de confianza en el post del framework de decisión.

¿Arreglará el hardware el sobrecoste?

Parcialmente, en un calendario creíble:

Disponible hoy: GPUs. Las cifras de bootstrap por debajo del milisegundo de arriba son reales y reproducibles hoy, mientras que la mainnet de Zama todavía ejecuta sus coprocesadores en CPUs a decenas de transacciones por segundo, con la migración a GPU en el roadmap de 2026. La aceleración por GPU aporta de uno a dos órdenes de magnitud y es la única aceleración que puedes comprar ahora mismo.
Silicio prototipo: Intel HERACLES. Intel demostró en ISSCC, en febrero de 2026, un acelerador FHE fabricado de 8192 vías SIMD y reportó mejoras de 1.074x a 5.547x frente a un Xeon en siete primitivas (IEEE Spectrum). Esto corrige dos errores opuestos: HERACLES no se detuvo y ya no es solo una simulación. Sigue siendo un prototipo de investigación sin disponibilidad comercial anunciada, así que diseña hoy para GPUs desplegables y trata los ASIC como potencial futuro.

¿Con qué librería deberías empezar?

Librería	Foco de esquema	Lenguaje	Elígela cuando
TFHE-rs / Concrete (Zama)	TFHE	Rust, Python	Lógica y enteros cifrados; el estándar de facto de TFHE con la comunidad más grande
Concrete ML (Zama)	TFHE	Python, API estilo scikit-learn	Inferencia privada en modelos pequeños; no está oficialmente deprecado, pero comprueba su cadencia de releases y encaje de soporte antes de un nuevo compromiso de producción (docs oficiales)
OpenFHE (consorcio)	Todos los esquemas principales	C++	Investigación multiesquema, interoperabilidad y funciones avanzadas; no es la elección automática por rendimiento para analítica CKKS
Poulpy	CKKS, FHE binario	Rust	Opción CKKS emergente y enfocada en CPU con backends AVX2, AVX-512 y ARM; v0.7 añadió bootstrapping CKKS completo, pero la API pública aún evoluciona (release v0.7)
FIDESlib	CKKS	C++ / CUDA	CKKS server-side sensible al rendimiento sobre GPUs NVIDIA; interoperable con clientes OpenFHE y reporta bootstrapping al menos 70x más rápido que OpenFHE optimizado con AVX (paper)
swift-homomorphic-encryption (Apple)	BFV	Swift	Lookups privados estilo PIR, especialmente en ecosistemas Apple
Lattigo (Tune Insight)	CKKS, BGV, multiparte	Go	Equipos de Go y montajes de HE multiparte
Microsoft SEAL	BFV, CKKS	C++	Integraciones existentes y un stack C++ compacto; no está deprecado y la versión 4.3.3 salió en mayo de 2026. Microsoft dejó de publicar nuevos paquetes NuGet, por lo que los equipos .NET deben compilar paquetes nuevos desde el código fuente (repositorio oficial)
HEIR (Google)	Compilador entre esquemas	Basado en MLIR	Compilar código de alto nivel a backends FHE; la capa de abstracción a largo plazo más probable (heir.dev)

Elecciones por defecto: TFHE-rs para lógica, la librería de Apple para PIR, y un benchmark del workload antes de elegir cualquier stack CKKS. Empieza el bake-off de CPU con Poulpy, Lattigo, SEAL y OpenFHE; añade una librería nativa de GPU como FIDESlib cuando el despliegue en NVIDIA sea aceptable. OpenFHE sigue siendo valioso por amplitud e interoperabilidad, pero librerías especializadas pueden ser uno o dos órdenes de magnitud más rápidas en rutas CKKS importantes. No elijas desde un ranking genérico: iguala tamaño de anillo, profundidad, precisión, frecuencia de bootstrapping, batch y hardware objetivo con tu workload real.

Preguntas frecuentes

¿Es práctico el cifrado totalmente homomórfico en 2026?

Sí, para workloads estrechos: lookups privados (el patrón de Apple y Microsoft), inferencia de ML con modelos pequeños, y lógica cifrada a decenas de transacciones por segundo. No, para computación de propósito general o interactiva, donde el sobrecoste de 1.000x a 10.000x todavía lo descarta. La decisión de alcance es todo el juego.

¿Cuál es la diferencia entre FHE y un TEE como Intel TDX o una GPU confidencial?

Un TEE ejecuta computación en texto plano dentro de aislamiento por hardware a velocidad casi nativa, pero confías en el fabricante del chip y en la ausencia de ataques de canal lateral. FHE elimina por completo esa confianza en el hardware a un coste de tres a cuatro órdenes de magnitud en rendimiento. La mayoría de los productos que necesitan cómputo confidencial a escala eligen hoy un TEE; FHE gana donde ninguna raíz de confianza en hardware es aceptable.

¿Puede FHE correr modelos estilo ChatGPT de forma privada?

No de forma interactiva en 2026. La investigación acelerada por GPU ha acelerado drásticamente la inferencia cifrada de clase GPT-2, pero la inferencia cifrada a escala frontier sigue lejos del tiempo real. Las cifras de minutos por token con gigabytes de tráfico que suelen citarse describen en realidad sistemas MPC, no FHE. Para inferencia privada de LLM hoy, las GPUs confidenciales son la opción pragmática.

¿Qué es TFHE frente a CKKS?

TFHE computa sobre bits y enteros pequeños con bootstrapping rápido, lo que lo hace ideal para comparaciones, ramas y lógica exacta. CKKS computa sobre números reales aproximados con empaquetado SIMD intensivo, lo que lo convierte en el esquema de elección para machine learning y estadística. Las aplicaciones serias suelen combinar ambos vía cambio de esquema.

¿Qué librería FHE debería usar un proyecto nuevo?

Elige por esquema y workload medido, no por prominencia del vendor. TFHE-rs es el default maduro para lógica TFHE, la librería Swift de Apple encaja con lookups BFV, y CKKS necesita un bake-off: Poulpy, Lattigo, SEAL y OpenFHE en CPU, más una opción nativa de GPU como FIDESlib cuando corresponda. OpenFHE ofrece una amplitud excepcional, pero no es automáticamente la implementación CKKS más rápida.

Reflexiones finales

El FHE en 2026 no es ni grial ni vaporware. Es una herramienta especialista con un patrón de producción probado: un cliente cifra una consulta pequeña, un servidor computa a ciegas, nadie salvo el usuario ve jamás los datos. Apple, Microsoft y Zama lanzan exactamente esa forma, y equipos de ingeniería fuertes pueden construirla hoy con stacks open source mantenidos.

La disciplina está en lo que te niegas a construir: cualquier cosa interactiva, cualquier cosa del tamaño de un modelo frontier, cualquier cosa donde una base de datos más control de acceso ya satisface el modelo de confianza. Limita FHE a la única computación que debe permanecer ciega, mide las librerías sobre el workload y hardware exactos, y deja que un TEE cargue con los workloads que FHE no puede. Así es como metes la garantía de privacidad más fuerte de la criptografía en un producto sin que el producto muera de latencia.

¿Quieres un chequeo honesto de viabilidad de FHE en tu stack?