Fully Homomorphic Encryption 2026: Was shipped und was noch Hype ist

TL;DR

FHE ist 2026 weder Gral noch Vaporware. Sie shipped in Produktion überall dort, wo der Workload ein enger Private Lookup ist: Apples Live Caller ID und Enhanced Visual Search, Microsoft Edges Password Monitor und Zamas Mainnet für verschlüsselte Transaktionen auf Ethereum bei Dutzenden Transaktionen pro Sekunde. Der ehrliche Overhead bleibt grob 1.000x bis 10.000x gegenüber Klartext, also ist alles Interaktive oder Frontier-Model-Große außerhalb des Scopes; die weit zitierten Minuten-pro-Token-Zahlen für verschlüsselte LLMs stammen in Wahrheit aus MPC-Forschung, nicht aus FHE. Die Scheme-Wahl ist die erste Entscheidung: TFHE für Logik und Vergleiche, CKKS für ML und Statistik, BFV für exakte Lookups. GPU-Beschleunigung ist real und lieferbar; Intel demonstrierte 2026 HERACLES-Silizium, doch es bleibt ein Forschungsprototyp. Starte mit TFHE-rs für Logik oder Apples Swift-Library für PIR, und benchmarke Poulpy, Lattigo, SEAL, OpenFHE sowie GPU-native Optionen wie FIDESlib vor der Wahl eines CKKS-Stacks. Die Zahlen sind eine Momentaufnahme aus Mitte 2026; prüfe nach, bevor du dich festlegst.

Fully Homomorphic Encryption hat den seltsamsten Ruf in der angewandten Kryptographie: gleichzeitig "der heilige Gral" und "für immer zehn Jahre entfernt". Beide Rufe sind inzwischen falsch. FHE läuft heute auf Hunderten Millionen iPhones, prüft Passwörter in Microsoft Edge und settelt verschlüsselte Transaktionen auf Ethereum. Sie ist außerdem noch immer drei bis vier Größenordnungen langsamer als Klartext, was das meiste ausschließt, wofür Leute sie sich vorstellen. Dieser Post zieht die Linie präzise: was FHE 2026 in Produktion leistet, was die ehrlichen Zahlen sind, und welche Claims du abwerten solltest. Der begleitende pragmatische Guide behandelt, wann FHE überhaupt das richtige Werkzeug ist.

Engineering-Perspektive, kein Vendor-Pitch. Wo eine Zahl von einem Hersteller stammt oder eine Roadmap-Projektion statt eines ausgelieferten Ergebnisses ist, kennzeichnen wir sie. Die Referenzpunkte stammen aus Wavects Frontier-Tech- und KI-Arbeit.

Du wägst FHE gegen ein TEE für dein Produkt ab?

Kostenloses Erstgespräch buchen

Was ist FHE, und warum wurde sie plötzlich interessant?

FHE lässt einen Server auf verschlüsselten Daten rechnen, ohne sie je zu entschlüsseln. Der Client verschlüsselt den Input, der Server rechnet blind, und nur der Client kann das Ergebnis entschlüsseln. Der Server erfährt nichts, nicht einmal die Antwort. Das ist ein kategorisch stärkeres Versprechen als Verschlüsselung at rest, und stärker als ein Trusted Execution Environment, weil kein Hardware-Hersteller im Trust Model steckt.

Interessant wurde sie aus zwei Gründen. Erstens Performance: Eine TFHE-Bootstrapping-Operation, die Grundeinheit unbegrenzter verschlüsselter Berechnung, fiel von Dutzenden Millisekunden auf einer CPU auf unter eine Millisekunde auf einer NVIDIA H100. Zweitens Glaubwürdigkeit: Apple shipped sie in Consumer-Skala, und Zama wurde mit einer 57-Millionen-Dollar-Series-B bei einer Bewertung über 1 Milliarde Dollar im Juni 2025 das erste Unicorn des Felds (Zama). Geld und Produktions-Deployments haben das Gespräch verändert.

Welches Scheme für welchen Job?

"FHE" ist eine Familie, und das falsche Mitglied zu wählen ist ein häufiger erster Fehler:

Scheme	Datenmodell	Stärke	Typische Nutzung
TFHE (CGGI)	Bits und kleine Integers	Schnelles programmierbares Bootstrapping, beliebige Logik via Lookup-Tables	Vergleiche, Branching-Logik, verschlüsselte Smart Contracts
CKKS	Approximative reelle Zahlen, SIMD-gepackt	Bester amortisierter Durchsatz für numerische Workloads	Machine-Learning-Inferenz, Statistik, Analytics
BGV / BFV	Exakte Integers, SIMD-gepackt	Exakte Arithmetik in Skalierung	Private Lookups (PIR), exakte Analytics, Zählungen

Daumenregel: Logik und Vergleiche wollen TFHE, ML will CKKS, exakte Lookups wollen BFV. Eine gute Einführung in die Schemes ist das 2025 erschienene "Beginner's Textbook for Fully Homomorphic Encryption" (arXiv 2503.05136). Moderne Stacks wechseln zunehmend mitten in der Berechnung das Scheme, genau dafür gibt es Compiler-Projekte wie Googles HEIR.

Was shipped tatsächlich in Produktion?

Die Produktionsliste ist kurz, real und lehrreich:

Apple Live Caller ID Lookup (iOS 18+). Dein iPhone prüft einen unbekannten Anrufer gegen die Datenbank eines Caller-ID-Anbieters, ohne dem Server die Telefonnummer zu verraten, mit BFV-basiertem Private Information Retrieval. Apple hat den Stack als swift-homomorphic-encryption open-sourced (Swift.org, 2024). Zusammen mit Enhanced Visual Search unten ist das vermutlich der größte Consumer-FHE-Footprint überhaupt.
Apple Enhanced Visual Search. Photos matcht Sehenswürdigkeiten in deinen Bildern gegen einen Server-Index, mit FHE plus Differential Privacy. Kryptographisch exzellent, und trotzdem eine Consent-Fallstudie: Apple aktivierte es per Default, ohne zu fragen, und kassierte im Januar 2025 einen berechtigten öffentlichen Backlash (The Register). Privacy-Tech entschuldigt kein übersprungenes Opt-in.
Microsoft Edge Password Monitor. Prüft deine Credentials homomorph gegen Breach-Korpora, sodass Microsoft das Passwort nie sieht. Gleiche architektonische Form wie Apples Deployment: ein Private Set Lookup.
Zama Protocol auf Ethereum. Mainnet seit Dezember 2025, ermöglicht verschlüsselte Token-Balances und vertrauliche Transfers auf öffentlichen Chains via TFHE (Zama Docs). Der Durchsatz liegt heute bei Dutzenden Transaktionen pro Sekunde; die veröffentlichte Roadmap Richtung Tausende via FPGAs und ASICs ist eine Projektion, kein ausgeliefertes Ergebnis.
Enterprise-Datenkollaboration. Duality Technologies betreibt homomorphe und föderierte Analytics mit Healthcare-Partnern wie Dana-Farber, typischerweise als Kombination aus HE und Federated Learning statt alles unter FHE laufen zu lassen.

Beachte, was jedes Consumer-Deployment gemeinsam hat: Es ist ein Private Lookup gegen ein Server-Dataset, in der Literatur als Private Information Retrieval bekannt. Kleine Query, begrenzte Berechnung, asynchron-tolerante Latenz. Das ist das Muster, das shipped. Niemand betreibt sein Backend unter FHE, auch nicht die Firmen mit dem meisten Geld der Welt.

"Jedes FHE-Deployment, das wirklich shipped ist, ist ein enger Private Lookup. Die Teams, die scheitern, sind die, die das ganze Backend verschlüsseln wollen."

Wie langsam ist FHE wirklich?

Die ehrlichen Zahlen, Stand Mitte 2026:

Genereller Overhead: grob 1.000x bis 10.000x gegenüber derselben Berechnung in Klartext, je nach Scheme und Workload. Additionen sind billig, Multiplikationen und Vergleiche teuer.
TFHE-Bootstrapping: einstellige Millisekunden auf einem modernen CPU-Kern, unter einer Millisekunde auf einer GPU der H100-Klasse, mit Berichten von rund 189.000 Bootstraps pro Sekunde auf einem 8-GPU-Node (Hersteller-Zahl).
Small-Model-ML-Inferenz: Logistische Regression, Decision Trees und kleine neuronale Netze laufen in Sekunden unter CKKS oder via Zamas Concrete ML, das quantisierte Modelle konvertiert und die Genauigkeit bei 4-Bit-Quantisierung innerhalb weniger Punkte von Klartext hält (Hugging Face / Zama).
PIR in Skalierung: heute praktikabel. Apple beantwortet verschlüsselte Lookups für einen großen Teil der iPhones der Welt mit akzeptabler Latenz und Serverkosten.

Plane mit der 1.000x-Regel: Braucht die Klartext-Berechnung eine Mikrosekunde, braucht die verschlüsselte Version eine Millisekunde und ist vermutlich machbar. Braucht die Klartext-Version eine Sekunde, braucht die verschlüsselte Version aufwärts von 15 Minuten und ist kein Produkt.

Kannst du ein LLM unter FHE laufen lassen?

Nein, nicht interaktiv, und diese Sektion existiert, weil die Zahlen, die am häufigsten als Gegenbeweis zitiert werden, auf lehrreiche Weise falsch sind. Die weit verbreitete Zahl "8,2 Minuten pro Token für GPT-2 mit 25,3 GB Kommunikation" stammt aus Forschung zu Secure Two-Party Computation, nicht FHE (arXiv 2410.13060). Die Gigabytes an Netzwerk-Traffic sind das verräterische Detail: MPC verbrennt Bandbreite zwischen Parteien, während FHE lokale Rechenleistung verbrennt, mit fast keiner Kommunikation. Die beiden zu verwechseln ist der häufigste technische Fehler in Content über Private AI.

Das tatsächliche FHE-Bild: GPU-beschleunigte Forschung lässt einen Forward Pass der GPT-2-Klasse grob 200x schneller laufen als CPU-Baselines (ICML 2025), was immer noch weit von interaktivem Chat entfernt ist. Hybride Schemes (Attention-Layer im Klartext, sensible Layer verschlüsselt) tauschen Privacy gegen Geschwindigkeit und bleiben Forschung. Was in Produktionsbegriffen funktioniert, ist Small-Model-Inferenz auf wirklich sensiblen Daten: Credit Scoring, medizinisches Pre-Screening, Fraud-Signale, wo ein paar Sekunden Latenz auf einem begrenzten Modell akzeptabel sind. Brauchst du heute private Frontier-Model-Inferenz, ist die pragmatische Antwort eine Confidential GPU (TEE der NVIDIA-H100-Klasse), und diese Trust Models vergleichen wir im Decision-Framework-Post.

Wird Hardware den Overhead beheben?

Teilweise, auf einer glaubwürdigen Timeline:

Heute lieferbar: GPUs. Die Unter-einer-Millisekunde-Bootstrap-Zahlen oben sind real und heute reproduzierbar, während Zamas Mainnet seine Coprozessoren weiterhin auf CPUs bei Dutzenden Transaktionen pro Sekunde betreibt, mit der GPU-Migration auf der 2026er-Roadmap. GPU-Beschleunigung liefert ein bis zwei Größenordnungen und ist die einzige Beschleunigung, die du jetzt kaufen kannst.
Prototyp-Silizium: Intel HERACLES. Intel demonstrierte im Februar 2026 auf der ISSCC einen gefertigten 8192-Way-SIMD-FHE-Beschleuniger und meldete über sieben Primitive hinweg 1.074x bis 5.547x Speedup gegenüber einem Xeon (IEEE Spectrum). Das korrigiert zwei gegensätzliche Fehler: HERACLES wurde nicht eingestellt und ist nicht mehr bloß eine Simulation. Es bleibt aber ein Forschungsprototyp ohne angekündigte kommerzielle Verfügbarkeit. Architektiere daher für heute einsetzbare GPUs und behandle ASICs als künftiges Upside.

Mit welcher Library solltest du starten?

Library	Scheme-Fokus	Sprache	Nimm sie, wenn
TFHE-rs / Concrete (Zama)	TFHE	Rust, Python	Verschlüsselte Logik und Integers; der De-facto-TFHE-Standard mit der größten Community
Concrete ML (Zama)	TFHE	Python, scikit-learn-artige API	Private ML-Inferenz auf kleinen Modellen; nicht offiziell deprecated, aber prüfe Release-Takt und Support-Fit vor einem neuen Produktions-Commitment (offizielle Docs)
OpenFHE (Konsortium)	Alle großen Schemes	C++	Multi-Scheme-Forschung, Interoperabilität und Advanced Features; nicht der automatische Performance-Pick für CKKS-Analytics
Poulpy	CKKS, Binary FHE	Rust	Eine aufkommende CPU-fokussierte CKKS-Option mit AVX2-, AVX-512- und ARM-Backends; v0.7 ergänzte vollständiges CKKS-Bootstrapping, die öffentliche API entwickelt sich aber noch (v0.7-Release)
FIDESlib	CKKS	C++ / CUDA	Performance-sensitives serverseitiges CKKS auf NVIDIA-GPUs; interoperabel mit OpenFHE-Clients und laut Paper beim Bootstrapping mindestens 70x schneller als AVX-optimiertes OpenFHE (Paper)
swift-homomorphic-encryption (Apple)	BFV	Swift	PIR-artige Private Lookups, besonders in Apple-Ökosystemen
Lattigo (Tune Insight)	CKKS, BGV, Multiparty	Go	Go-Shops und Multiparty-HE-Setups
Microsoft SEAL	BFV, CKKS	C++	Bestehende Integrationen und ein kompakter C++-Stack; nicht deprecated, Version 4.3.3 erschien im Mai 2026. Microsoft veröffentlicht keine neuen NuGet-Pakete mehr, daher müssen .NET-Teams neuere Pakete aus dem Source bauen (offizielles Repository)
HEIR (Google)	Compiler über Schemes hinweg	MLIR-basiert	High-Level-Code auf FHE-Backends kompilieren; die wahrscheinlichste langfristige Abstraktionsschicht (heir.dev)

Default-Picks: TFHE-rs für Logik, Apples Library für PIR und ein Workload-Benchmark vor jeder CKKS-Entscheidung. Starte den CPU-Bake-off mit Poulpy, Lattigo, SEAL und OpenFHE; nimm eine GPU-native Library wie FIDESlib dazu, wenn NVIDIA-Deployment passt. OpenFHE bleibt wertvoll für Breite und Interoperabilität, doch spezialisierte Libraries können auf wichtigen CKKS-Pfaden ein bis zwei Größenordnungen schneller sein. Wähle nicht nach einem generischen Leaderboard: Ringgröße, Tiefe, Präzision, Bootstrapping-Häufigkeit, Batch-Größe und Zielhardware müssen deinem echten Workload entsprechen.

Häufig gestellte Fragen

Ist Fully Homomorphic Encryption 2026 praktikabel?

Ja, für enge Workloads: Private Lookups (das Apple- und Microsoft-Muster), Small-Model-ML-Inferenz und verschlüsselte Logik bei Dutzenden Transaktionen pro Sekunde. Nein, für General-Purpose- oder interaktive Berechnungen, wo der 1.000x-bis-10.000x-Overhead sie weiterhin ausschließt. Die Scoping-Entscheidung ist das ganze Spiel.

Was ist der Unterschied zwischen FHE und einem TEE wie Intel TDX oder einer Confidential GPU?

Ein TEE führt Klartext-Berechnungen in Hardware-Isolation bei nahezu nativer Geschwindigkeit aus, aber du vertraust dem Chip-Hersteller und darauf, dass keine Side-Channel-Angriffe existieren. FHE entfernt dieses Hardware-Vertrauen komplett, zum Preis von drei bis vier Größenordnungen Performance. Die meisten Produkte, die heute Confidential Compute in Skalierung brauchen, wählen ein TEE; FHE gewinnt, wo kein Hardware-Trust-Root akzeptabel ist.

Kann FHE ChatGPT-artige Modelle privat betreiben?

Nicht interaktiv in 2026. GPU-beschleunigte Forschung hat verschlüsselte Inferenz der GPT-2-Klasse dramatisch beschleunigt, aber verschlüsselte Inferenz in Frontier-Größe bleibt weit von Echtzeit entfernt. Die oft zitierten Minuten-pro-Token-Zahlen mit Gigabytes an Traffic beschreiben in Wahrheit MPC-Systeme, nicht FHE. Für private LLM-Inferenz sind heute Confidential GPUs die pragmatische Option.

Was ist TFHE versus CKKS?

TFHE rechnet auf Bits und kleinen Integers mit schnellem Bootstrapping, ideal für Vergleiche, Branching und exakte Logik. CKKS rechnet auf approximativen reellen Zahlen mit starkem SIMD-Packing, das Scheme der Wahl für Machine Learning und Statistik. Ernsthafte Anwendungen kombinieren oft beide via Scheme-Switching.

Welche FHE-Library sollte ein neues Projekt nutzen?

Wähle nach Scheme und gemessenem Workload, nicht nach Vendor-Prominenz. TFHE-rs ist der reife Default für TFHE-Logik, Apples Swift-Library passt zu BFV-Private-Lookups, und CKKS braucht einen Bake-off: Poulpy, Lattigo, SEAL und OpenFHE auf CPU plus gegebenenfalls eine GPU-native Option wie FIDESlib. OpenFHE bietet außergewöhnliche Breite, ist aber nicht automatisch die schnellste CKKS-Implementierung.

Fazit

FHE ist 2026 weder Gral noch Vaporware. Sie ist ein Spezialwerkzeug mit einem bewiesenen Produktionsmuster: Ein Client verschlüsselt eine kleine Query, ein Server rechnet blind, niemand außer dem User sieht je die Daten. Apple, Microsoft und Zama shippen alle genau diese Form, und starke Engineering-Teams können sie heute mit gewarteten Open-Source-Stacks bauen.

Die Disziplin liegt in dem, was du dich weigerst zu bauen: alles Interaktive, alles in Frontier-Model-Größe, alles, wo eine Datenbank plus Access Control das Trust Model schon erfüllt. Scope FHE auf die eine Berechnung, die blind bleiben muss, benchmarke Libraries auf dem exakten Workload und der Zielhardware, und lass ein TEE die Workloads tragen, die FHE nicht kann. So bekommst du die stärkste Privacy-Garantie der Kryptographie in ein Produkt, ohne dass das Produkt an Latenz stirbt.

Ehrlicher Feasibility-Check für FHE in deinem Stack gefällig?