Ein MCP-Client übergibt ein audience-gebundenes Token an einen Resource Server, der es gegen einen Identity Provider validiert, bevor ein Tool läuft

Enterprise MCP Authorization: Multi-Tenant-Referenzarchitektur

OAuth 2.1, audience-gebundene Tokens und kein Token-Passthrough sind die harten Regeln der Spec. Der Rest, Multi-Tenant-Isolation, Per-Tool-Scopes, delegierter Zugriff und Audit, ist Referenzdesign. Hier ist die komplette Trust Boundary in zwei Diagrammen.

AI Act Artikel 50: Transparenzpflichten als Build-Checkliste für SaaS-Chatbots, KI-Agenten und generierte Inhalte

Business & Regulierung

23. Juli 2026

AI Act Artikel 50 Checkliste für SaaS und KI-Agenten

Artikel 50 gilt ab 2. August 2026. Die technische Build-Checkliste: Chatbot- und Agenten-Hinweis, C2PA-Kennzeichnung, Deepfake-Label, KI-Texte, Logging und die Nachweise, die du für ein Audit brauchst.

Datenunabhängige Vektorquantisierung komprimiert ein dichtes float32-Embedding-Feld in ein kompaktes 2-Bit-Raster mit 16x weniger Speicher

KI & Agenten

23. Juli 2026

RAG-Vektorspeicher 16x kleiner: Ist datenunabhängige Quantisierung produktionsreif?

Ein neuer Rust-Index schrumpft 10M Embeddings von 31 GB auf 4 GB mit Googles trainingsfreiem TurboQuant. Was die Methode beweist, wo sie FAISS schlägt, der Recall-Kompromiss und wie du sie pilotierst.

Acht isolierte KV Caches pro Rank auf einem Server, die zu einer einzigen gemeinsamen host-seitigen Cache-Schicht verschmelzen, aus der jeder Serving-Prozess lesen kann

KI & Agenten

23. Juli 2026

Gemeinsamer KV Cache senkte LLM-Inferenzlatenz um 14x, ohne neue GPUs

Eine quelloffene KV-Cache-Schicht senkte die mittlere Time-to-first-token von 3.98s auf 0.29s auf einem 235B-Modell. Gleiche GPUs, gleicher Speicher. Sie stoppte acht Prozesse davon, private Caches zu horten. Was sich änderte und ob es dir hilft.

Verlustfreie BF16-Gewichtskompression im Vergleich zu 8-bit GGUF nach Exaktheit, Runtime-Evidenz und Production Readiness

KI & Agenten

22. Juli 2026

Verlustfreie LLM-Kompression vs. 8-bit GGUF: Was ist produktionsreif?

Faktenbasierte Entscheidungshilfe zu GLM-5.2, exakter BF16-Decodierung, Q8-Quantisierung, Runtime-Evidenz, Fleet Economics und 14-Tage-Pilot.

Bezahltes Pilotprojekt, Proof of Concept und Design Partner im Vergleich nach ihrer kommerziellen Beweiskraft

Produkt & MVP

22. Juli 2026

Bezahlter Pilot vs. PoC vs. Design Partner: Was beweist Nachfrage?

Entscheidungshilfe für Machbarkeit, Kundenlernen oder Zahlungsbereitschaft, mit Sieben-Punkte-Scorecard und Commercial Brief für den Pilotvertrag.

KI & Agenten

22. Juli 2026

OpenAI Eval-Sandbox-Escape: 12 Kontrollen für Cyber-Agenten

Faktencheck und Procurement-Checkliste für verschachtelte Isolation, Egress, Credentials, getrennte Control Plane, Benchmark-Integrität, Monitoring und Forensik-Fallback.

Parallele KI-Coding-Agenten arbeiten in isolierten Git Worktrees oder Jujutsu Workspaces auf einem gemeinsamen Repository-Speicher

Software Delivery & QA

22. Juli 2026

Git Worktrees vs. Jujutsu für KI-Coding-Agenten: Entscheidungshilfe 2026

Buyer Guide zu Repository-Cache, Partial Clone, Git Worktrees und Jujutsu Workspaces, mit Kompatibilitätslücken, Kostenmetriken und messbarem 14-Tage-Pilot.

Cisco Antares ordnet eine CWE-Beschreibung lokal Kandidatendateien zu, ohne das Repository in die Cloud zu schicken

KI & Agenten

22. Juli 2026

Cisco Antares im Test: Lokale Schwachstellen-Triage ohne Cloud

Buyer Review zu Antares-1B, VLoc Bench, GGUF und llama.cpp, privater CWE-Triage, CI/CD-Integration, Sicherheitsgrenzen und messbarem 14-Tage-Pilot.

KI & Agenten

22. Juli 2026

Meterless im Test 2026: Ist der Context Layer produktionsreif?

Faktencheck für Käufer zu H-MEM, World Model, Markovian und Scout, einschließlich Token-Modell, Lizenzgrenze, Produktionslücken und Zwei-Wochen-Pilot.

Sechs Softwareagenturen in Tirol nach Projektfit verglichen

Business & Regulierung

19. Juli 2026

Softwareagenturen in Tirol im Vergleich 2026

Sechs Anbieter, sechs unterschiedliche Stärken. Offengelegt, quellenbasiert und ohne erfundenen Gesamtsieger.

KI-Agent-SLA mit messbaren Task-Ergebnissen, Latenz, Human Handoff, Audit-Traces und vertraglichen Rechtsfolgen

Business & Regulierung

19. Juli 2026

KI-Agent-SLA-Vorlage: Genauigkeit, Latenz, Human Handoff und Auditierbarkeit

Kopierfertiger Vertragsanhang mit Formeln für Task-Erfolg, materielle Halluzination, Tool-Nutzung, p95-Latenz, Handoff, Dependencies, Modellwechsel, Trace-Retention, Severity und Service Credits.

Nemotron 3.5 ASR wandelt mehrsprachige Audiostreams hinter einem Production Gate in Text um

KI & Agenten

19. Juli 2026

NVIDIA Nemotron 3.5 ASR: Ist Self-Hosted STT bereit für Voice Agents?

Buyer-Review zum 80-ms-Claim, zur 40-Locale-Einschränkung, H100-Concurrency, OpenMDW-Lizenz, Whisper-Trade-offs und einem messbaren Production-Pilot.

Claude Code und OpenCode im Vergleich nach Token-Overhead, Cache-Kosten, Teamkontrollen und Kosten pro akzeptiertem Task

KI & Agenten

19. Juli 2026

Claude Code vs OpenCode: Was kostet dein Team 2026 weniger?

Buyer-Vergleich mit gemessenem Harness-Overhead, Cache-Ökonomie, Abo versus BYOK, Enterprise-Kontrollen und reproduzierbarem Benchmark pro akzeptiertem Task.

Kimi K3 API im Produktionscheck für europäische Unternehmen

KI & Agenten

19. Juli 2026

Kimi K3 für EU-Unternehmen: API-Kosten, Datenschutz und Pilotplan

Buyer-Review zu K3-Preisen, unabhängiger Performance, Datenstandort Singapur, widersprüchlichen öffentlichen Terms, API-Limits, Self-Hosting und einem gemessenen Zwei-Wochen-Pilot.

Mesh LLM verteilt ein großes Modell als zusammenhängende Layer-Stages auf drei Rechner

KI & Agenten

18. Juli 2026

Mesh LLM im Test: Ein großes LLM auf mehreren Rechnern ausführen?

Buyer Review zu verteilter lokaler Inferenz: Wie Skippy Speicher über Layer-Stages kombiniert, warum Kapazität nicht linear beschleunigt, was Benchmarks belegen und wie ein sicherer Pilot aussieht.

EU-Sicherheitsfragebogen für KI-Anbieter mit 45 Nachweis- und Vertragsprüfungen

Business & Regulierung

17. Juli 2026

EU-Fragebogen zur Sicherheit von KI-Anbietern: 45 Fragen vor der Unterschrift

Evidenzbasierte KI-Procurement-Checkliste zu Training, Retention, Subprozessoren, Regionen, Logs, Berechtigungen, Modelländerungen, Incidents, Evals, Löschung, Exit und AI-Act-Rollen. Mit mehrsprachigem Spreadsheet.

KI-Adoption DACH Benchmark 2026 für Österreich, Deutschland und die Schweiz

Business & Regulierung

17. Juli 2026

KI-Adoption DACH Benchmark 2026: Was KMU produktiv einsetzen

Quellenbasierte Nutzungs- und Use-Case-Daten für Österreich, Deutschland und die Schweiz, plus die Produktions-, Budget-, Ownership- und Shelfware-Kennzahlen, die Studien noch nicht messen.

Graphify Knowledge Graph verbindet Code, Daten, Infrastruktur und Dokumentation

KI & Agenten

16. Juli 2026

Graphify Review 2026: Lohnt sich ein Knowledge Graph für deine Codebasis?

Buyer Review zu Graphify vs. Suche und RAG: Architektur, Datengrenzen, Benchmark-Limits, echte Einführungskosten und messbarer Zwei-Wochen-Pilot.

Bonsai 27B als 1-Bit-Modell von 54 GB auf Smartphone-Größe komprimiert

KI & Agenten

16. Juli 2026

Bonsai 27B im Test: Läuft ein 27B-LLM wirklich auf dem Smartphone?

Verifizierter Buyer-Review: 1-Bit vs Ternary, echter Speicher, ungleiche Benchmark-Verluste, Smartphone- und WebGPU-Tempo, Use Cases und Pilot-Gates.

Kill-or-Scale-Scorecard für KI-Piloten mit 12 Kennzahlen

KI & Agenten

16. Juli 2026

KI-Pilot Kill-or-Scale-Scorecard: 12 Kennzahlen nach 30 Tagen

Eine entscheidungsreife Scorecard mit Formeln, harten Gates und Rechenbeispiel zu Kosten, Automatisierung, Fehlern, Latenz, Adoption, Auditierbarkeit, Datenreife und Amortisation.

Soofi S im Beschaffungscheck für souveräne europäische KI

KI & Agenten

16. Juli 2026

Soofi S: Ist Deutschlands souveränes LLM bereit für Unternehmen?

Deutschlands neues 30B-Sparse-Modell ist stark auf Deutsch und bei Code, doch der öffentliche Release bleibt ein gated Preview mit unvollständiger Lizenz. Benchmarks, Offenheit, Infrastruktur, Alternativen und Pilot-Checkliste.

T3MP3ST als autonomes KI-Red-Team-System im Vergleich mit OWASP APTS

KI & Agenten

15. Juli 2026

T3MP3ST Review 2026: Ersetzt es einen Penetrationstest?

Buyer-orientierter Review: belegte Single-Agent-Fähigkeiten versus unbewiesener Swarm, gegen OWASP APTS geprüft und mit einer sicheren Pilotentscheidung für CTOs.

Vibe Coder und Junior Developer auf unterschiedlichen Wegen durch ein KI-gestütztes Engineering-System

Führung & Teams

15. Juli 2026

Sind Vibe Coder die neuen Junior Developer?

Der klassische Ticket-Junior schrumpft, doch Junior Developer sterben nicht aus. Arbeitsmarktdaten, der Unterschied zwischen Prompting und Engineering und ein Hiring-Modell für KI-native Einstiegstalente.

Externer QA-Benchmark für Softwaredefekte in den ersten 30 Tagen

Software Delivery & QA

15. Juli 2026

Externer QA-Benchmark: Was wir in den ersten 30 Tagen finden

Research-basierter Defect-Benchmark für Berechtigungen, Regressionen, Browser-/Device-Kombinationen, Datenintegrität, KI-Fehler und Production Escapes, und warum es keinen ehrlichen universellen Bug-Median gibt.

Programmiersprachen laufen in Entscheidungen über Runtime, Speicher und Architektur zusammen

Software Delivery & QA

15. Juli 2026

Programmiersprachen werden unwichtiger. Software Engineering wird wichtiger.

KI macht Syntax, Boilerplate und Übersetzung billig. Sie beseitigt weder Runtime-, Speicher-, Concurrency- und Security-Trade-offs noch Wartungskosten. Worauf CTOs und Engineers jetzt optimieren sollten.

Colibri streamt GLM-5.2-Experten auf Consumer-Hardware von NVMe über RAM bis VRAM

KI & Agenten

14. Juli 2026

Colibri führt GLM-5.2 auf Consumer-Hardware aus. Der Haken.

Colibri führt ein MoE-Modell mit 744 Milliarden Parametern und rund 25 GB RAM aus, indem Experten aus einem 370-GB-int4-Checkpoint gestreamt werden. Der ehrliche Test: echte Geschwindigkeit, SSD-Verschleiß, Cache-Physik, GPU-Grenzen und sinnvolle Einsatzfälle.

Die Zukunft von Enterprise Software: KI bringt Systems Engineering zurück und Dezentralisierung macht es beweisbar

Software Delivery & QA

14. Juli 2026

Die Zukunft von Enterprise Software

Enterprise Software zerfiel in Distributed Monoliths und SaaS-Sprawl. Alexandre Kotcherguine und Kevin Riedl zeigen, wie KI ganzheitliches Systems Engineering wieder bezahlbar macht und Dezentralisierung Architekturversprechen in unabhängig verifizierbare Garantien verwandelt.

Kommentiertes Softwareagentur-Angebot mit zwölf Klauseln zu Preis, Scope und Eigentum

Business & Regulierung

13. Juli 2026

Softwareagentur-Angebot im Check: 12 Klauseln zu Preis, Scope und Eigentum

Klausel-für-Klausel-Analyse eines fiktiven Softwareangebots über EUR 96.000: Abnahme, IP, Änderungen, Gewährleistung, Abhängigkeiten, Hosting, Lizenzen, Übergabe, Kündigung, Security, Subunternehmer und Definition of Done - inklusive 24-Punkte-Prüfraster.

x402-Zahlungsimplementierungen von Coinbase, Stripe, Cloudflare, AWS und Circle im Vergleich

Web3 & Datenschutz

12. Juli 2026

x402-Zahlungen 2026: Coinbase, Stripe & Alternativen

x402 macht HTTP 402 zur Zahlungs-Verhandlung für APIs, MCP-Tools und KI-Agenten. Coinbase, Stripe, Circle, Cloudflare, AWS, thirdweb, PayAI und Self-Hosting nach Schicht, Netzwerk, Gebühren, Compliance und Produktionsrisiko verglichen.

KI & Agenten

12. Juli 2026

Open Knowledge Format (OKF): Der Unternehmensleitfaden

Googles neuer OKF-v0.1-Entwurf macht Unternehmenswissen zu verlinktem Markdown mit YAML. Aufbau, Vergleich mit RAG und MCP, Grenzen und ein Pilotplan ohne das nächste vergessene Wiki.

Software-Wartungskosten-Benchmark für DACH-SaaS: Jahr eins, zwei und drei nach Launch

Software Delivery & QA

10. Juli 2026

Was Software-Wartung nach dem Launch kostet: Ein DACH-SaaS-Benchmark

Post-Launch-Wartungskosten für DACH-SaaS: Jahr eins, zwei und drei getrennt nach Bugfixes, Dependency-Upgrades, Cloud, Observability, Security, Compliance, Support, Produktiteration und Notfällen, inklusive interaktivem Rechner.

Smart-City-Architektur: MQTT, ChirpStack, LoRaWAN, Kubernetes und Terraform

Software Delivery & QA

9. Juli 2026

Smart-City-Architektur: MQTT, LoRaWAN, Kubernetes und Terraform

Ein vendor-neutraler Guide für Smart-City-Plattformen, die Produktion aushalten: MQTT am Edge, LoRaWAN und ChirpStack für private Sensornetze, FIWARE/NGSI-LD und SensorThings für Interoperabilität, Terraform für wiederholbare Infrastruktur und Kubernetes erst, wenn dein Team es betreiben kann.

AI Agent Cost per Action: Support-Tickets, Rechnungen, PR-Reviews und Lead-Enrichment nach Geschäftsergebnis messen

KI & Agenten

9. Juli 2026

AI Agent Cost per Action: Warum agentische Workflows Token-Rechnungen sprengen

Executives kaufen keine Tokens. Sie kaufen Aktionen: gelöste Support-Tickets, extrahierte Rechnungen, reviewte PRs und angereicherte Leads. Der Rechner, der Modell-Calls, Tool-Calls, Retries, Verifier, Cache-Hits und fehlgeschlagene Versuche in Cost per Action übersetzt.

Wann lokale Modelle APIs schlagen: EU-Break-even-Rechner für LLM-Self-Hosting

KI & Agenten

8. Juli 2026

Wann lokale Modelle APIs schlagen: Break-even-Rechner für EU-Unternehmen

Self-Hosting eines LLM gewinnt nur, wenn Auslastung, Governance und Ops zusammenpassen. Der Rechner, um API-Ausgaben gegen GPU-Stunden, Engineer-Zeit, Eval-Pflege, Concurrency und EU-Datenresidenz zu vergleichen.

LLM-Kostenrechner 2026: Cost per Task, Prompt Caching, Batching, Routing und Self-Hosting

KI & Agenten

8. Juli 2026

LLM-Kostenrechner 2026: Rechne pro Aufgabe, nicht pro Token

Die Spreadsheet-Logik hinter deiner echten KI-Rechnung: erledigte Aufgaben statt Tokenpreise zählen. Formeln für gecachten Input, Batch-Rabatte, Routing-Eskalation, Self-Host-Auslastung, Retries, menschliche Nacharbeit und Eval-Qualität.

Die Fabrik kehrt zurück: KI belebt den Traum von der Software-Fabrik wieder, und Governance entscheidet, ob die Agilität das überlebt

Software Delivery & QA

7. Juli 2026

Die Fabrik kehrt zurück

Agentische KI belebt den zweimal gescheiterten Traum von der Software-Fabrik wieder. Alexandre Kotcherguine und Kevin Riedl wägen die Evidenz zu Technical Debt und Produktivität auf beiden Seiten ab, verfolgen das Handwerk nach oben im Stack in Spezifikationen und Quality Gates und lesen Stripes Agenten-Flotte als die These im Produktivbetrieb.

Echte Anwendungen mit Zero-Knowledge-Proofs und FHE bauen 2026: ein pragmatischer Guide

Web3 & Datenschutz

5. Juli 2026

Echte Anwendungen mit ZK und FHE bauen 2026: Ein pragmatischer Guide

Apple betreibt FHE auf Millionen iPhones und Google Wallet beweist dein Alter mit ZK, und trotzdem scheitern die meisten Projekte, die mit der Technologie starten. Der Entscheidungsbaum, die ehrlichen 2026er-Kostenzahlen, und die fünf Failure-Modes, die wir in Privacy-Tech-Builds sehen.

Zero-Knowledge-Proofs 2026: zkVMs, Client-side Proving und was production-ready ist

Web3 & Datenschutz

5. Juli 2026

Zero-Knowledge-Proofs 2026: Was wirklich production-ready ist

Einen Ethereum-Block zu beweisen fiel in einem Jahr von 1,69 Dollar auf unter 4 Cent, und ZK-Identity landete in Google Wallet. Auf welchen zkVMs man baut, was Proving kostet, was auf einem Phone funktioniert, und wo die Security-Leichen begraben liegen.

Fully Homomorphic Encryption 2026: Was in Produktion shipped und was noch Hype ist

Web3 & Datenschutz

5. Juli 2026

Fully Homomorphic Encryption 2026: Was shipped und was noch Hype ist

FHE läuft auf iPhones und settelt verschlüsselte Transaktionen auf Ethereum, bleibt aber drei bis vier Größenordnungen langsamer als Klartext. Das Produktionsmuster, das funktioniert, die ehrlichen Overhead-Zahlen, und der Encrypted-LLM-Reality-Check.

ZK vs FHE vs MPC vs TEE: das 2026er-Decision-Framework für Architekten

Web3 & Datenschutz

5. Juli 2026

ZK vs FHE vs MPC vs TEE: Wie du 2026 wählst

Vier Privacy-Technologien, vier Trust Models, vier Preisschilder. Die vier Fragen, die die richtige auswählen, ein Vergleich Seite an Seite mit ehrlichen Zahlen, und die EU-Regulierungen, die die Wahl zunehmend erzwingen.

Open USD erklärt: ein Konsortium-Stablecoin von Visa, Mastercard, Stripe und anderen

Web3 & Datenschutz

4. Juli 2026

Open USD erklärt: Was ein Konsortium-Stablecoin verändert

Visa, Mastercard, Stripe, Coinbase und BlackRock stehen hinter einem Stablecoin mit geteilten Reserven, und Circle fiel um 16 bis 18 Prozent. Was Open USD wirklich verändert, warum der Coin noch nicht live ist, und was du prüfen solltest, bevor du auf einem Stablecoin baust.

Deinen Prompt als Bild rendern, um LLM-Kosten zu senken: der pxpipe-Trick, ehrlich erklärt

KI & Agenten

3. Juli 2026

Prompt als Bild rendern, um LLM-Kosten um 60% zu senken: genial oder absurd?

Ein viraler Trick rendert System-Prompt und History als PNGs, um Fable-5-Rechnungen um 60 Prozent zu senken, weil Bilder nach Pixeln bepreist werden, nicht nach Text. Die Physik ist real und in der DeepSeek-OCR-Forschung verankert. Der Haken: verlustbehaftet und stumm scheiternd, exakte Werte müssen Text bleiben.

Kosten pro Token versus Kosten pro Aufgabe: Ein niedrigerer Stückpreis kann trotzdem eine höhere Gesamtrechnung erzeugen

KI & Agenten

2. Juli 2026

Pro Token günstiger. Pro Antwort teurer.

Sonnet 5 startete pro Token günstiger als Opus 4.8, kostete im vollständigen Benchmark aber mehr pro erledigter Aufgabe. Warum Cost per Task, nicht der Preis pro Token, die Zahl auf deiner Rechnung ist.

Coding mit Claude Fable 5: Model-Routing über Fable, Opus, Sonnet und Haiku

KI & Agenten

2. Juli 2026

Fable ist zurück. So codest du wirklich damit.

Fable 5 ist wieder da, hinter strengeren Classifiern, die manchmal auf Opus 4.8 zurückfallen. Nutze es nicht wie Autocomplete: nutze es für Architektur, Migrationsplanung und finalen Review, und route den Rest an günstigere Modelle.

Anthropics Krieg gegen Open-Source-KI ist in Wahrheit ein Kampf um die Kosten von Intelligenz

KI & Agenten

1. Juli 2026

Dario hat Open Source den Krieg erklärt. Der echte Krieg geht um deine KI-Rechnung.

Anthropic warf chinesischen Laboren vor, seine Modelle gestohlen zu haben, und bat Washington um Eingreifen. Streiche die Geopolitik, und es ist ein Kampf um den Preis von Intelligenz. Coinbase hat seine KI-Rechnung mit Open Weights und Routing bereits um 50 % gesenkt. Unsere Lesart, und die EU-Absicherung.

Agile De-Engineering und die Erosion der Engineering-Kultur im Enterprise

Software Delivery & QA

30. Juni 2026

Agile De-Engineering

Wie eine Bewegung zur Befreiung von Engineers die Engineering-Kultur im Enterprise aushöhlte. Alexandre Kotcherguine und Kevin Riedl zeichnen Kommerzialisierung, Ritual Capture, Metrikumkehr und die Erosion des Handwerks nach.

Kosten eines internen KI-Assistenten in DACH 2026

KI & Agenten

29. Juni 2026

Was ein interner KI-Assistent in der DACH-Region wirklich kostet (2026)

Embeddings, Vektor-DB, Tokens, Hosting und die Wartungszeile, die alle vergessen. Eine Richtwert-Kostenaufstellung pro Sitz für einen internen DACH-KI-Assistenten.

Das Minimum Credible Product ersetzt das klassische MVP im KI-Zeitalter

Produkt & MVP

28. Juni 2026

Das MVP ist tot. Bau ein Minimum Credible Product.

KI macht Prototypen billig, nicht Produktentscheidungen. Die Rauheit des klassischen MVP beschädigt heute oft genau das Signal, das es sammeln soll. Ein Plädoyer für weniger Scope, einen vertrauenswürdigen Kernpfad und belastbare Evidenz.

KI & Agenten

27. Juni 2026

LLM-Gateways im Vergleich 2026: LiteLLM vs OpenRouter vs Portkey vs RouteLLM

Ein Endpoint über viele Provider, mit Fallback, Caching, Spend-Limits und Routing an einem Ort. Wie sich LiteLLM, OpenRouter, Portkey und RouteLLM unterscheiden, und wie du nach der Einschränkung wählst, die dich bindet.

Open-Weight-LLMs in der EU selbst hosten

KI & Agenten

26. Juni 2026

LLMs in der EU selbst hosten: Wann sich Open Weights wirklich rechnen

Die GPU ist der günstige Teil. Hier sind die echten Kosten von Self-Hosting, der Token-pro-Tag-Break-even gegen Hosted APIs, wann Datenresidenz dich zwingt, und der vLLM-Produktions-Stack.

Open-Weight-LLM-Vergleich 2026: DeepSeek vs Qwen vs Kimi vs GLM vs Llama

KI & Agenten

25. Juni 2026

Open-Weight-LLM-Showdown 2026: DeepSeek vs Qwen vs Kimi vs GLM vs Llama

DeepSeek, Qwen, Kimi K2, GLM und Llama im Vergleich: Preis, Coding- und Reasoning-Qualität, Kontextfenster, Lizenz und EU-Self-Host, plus die Entscheidungsreihenfolge, die wir vor einem Modell-Deployment fahren.

Ehrlicher Leitfaden zu KI-Beratung in Österreich 2026

Business & Regulierung

24. Juni 2026

KI-Beratung Österreich 2026: der ehrliche Guide

Strategie, Workshop, Automation, RAG, Copilot oder Custom Agent? Ehrliche Kosten, echte Use Cases, Förderung und der aktuelle Stand zum EU AI Act für KMU. Stand Mitte 2026.

Warum Kontext, nicht Intelligenz, der eigentliche Engpass in Software war

KI & Agenten

23. Juni 2026

Der Engpass war nie Intelligenz. Es war Kontext.

Rakuten ließ einen Coding-Agenten sieben Stunden auf vLLM mit 99,9% Genauigkeit laufen. Die eigentliche Lektion sind nicht die Stunden. Es ist, dass Kontext, nicht Intelligenz, der Engpass war, und dass das Steuern von Agenten zur neuen Deep Work wurde.

ChatGPT Enterprise, Microsoft 365 Copilot und ein eigenes RAG im Vergleich für ein DACH-Unternehmen

KI & Agenten

22. Juni 2026

ChatGPT Enterprise vs. Copilot vs. eigenes RAG

Copilot, wenn du in M365 lebst. ChatGPT Enterprise für verteilte Daten. Eigenes RAG nur für volle Kontrolle. Keines ist allein DSGVO-konform, du bleibst der Verantwortliche. Stand Mitte 2026.

Wo deine KI-Daten gespeichert und verarbeitet werden, über die EU-Residenz-Optionen hinweg

Business & Regulierung

21. Juni 2026

EU-Datenresidenz für KI-Apps 2026

OpenAI, Azure, Mistral, Hetzner oder Self-Hosting? Die Falle, die fast jeder übersieht: EU-Datenresidenz meint meist Speicherung in der EU, nicht dass das Modell in der EU läuft.

Sicherheit, IP und Investorenreife für mit Lovable, Bolt und Replit gebaute Apps

Software Delivery & QA

20. Juni 2026

Due Diligence für Lovable-, Bolt- und Replit-Apps

Bevor du auf einer KI-gebauten App eine Runde aufnimmst oder verkaufst, entscheiden drei Fragen: Ist sie sicher, gehört sie dir, ist sie wartbar? Die Checkliste für Sicherheit, IP und Investorenreife.

Die vier Wege zur KI-Förderung in Österreich 2026

Business & Regulierung

19. Juni 2026

KI-Förderung Österreich 2026: aws, FFG, Forschungsprämie

Die vier Wege zur KI-Förderung in Österreich 2026, ehrlich eingeordnet: aws fürs Einführen, FFG fürs Forschen, 14 Prozent Forschungsprämie, KMU.DIGITAL. Plus der Haken: offene Calls und Budget.

KI 2026 intern ausrollen, ohne Shelfware

Führung & Teams

18. Juni 2026

KI 2026 intern ausrollen

Die meisten internen KI-Rollouts bleiben als Shelfware stecken. Die Reihenfolge, die wir anwenden: das Team bilden, den echten Prozess mappen, Kosten und Compliance klären, einen Workflow in Produktion bringen, dann übergeben, damit dein Team ihn besitzt.

MCP, RAG, Agent Skills und Custom GPTs als Schichten eines KI-Systems

KI & Agenten

17. Juni 2026

MCP vs RAG vs Agent Skills vs Custom GPTs

Keine vier Antworten auf eine Frage, sondern vier Schichten: RAG für Wissen, MCP für Anbindung, Skills für Prozedur, Custom GPTs als verpackte Fläche. Ein Entscheidungsbaum, plus warum du sie meist kombinierst.

Fractional CTPO vs ein Fractional CTO und CPO

Führung & Teams

17. Juni 2026

Fractional CTPO vs CTO und CPO

Wann ein kombinierter Kopf für Produkt und Technik das getrennte Einstellen von Fractional CTO und CPO schlägt, der Acht-Entwickler-Split-Punkt und der Single-Point-of-Failure-Trade-off.

Technische-Due-Diligence-Checkliste für ein KI-MVP vor der Finanzierungsrunde

Produkt & MVP

16. Juni 2026

Technische Due Diligence für KI-MVPs vor der Finanzierung

Welche KI-spezifischen Punkte Investoren bei einem KI-MVP prüfen: Evals als Nachweis, Versionierung, Inferenzkosten, Datenrechte, EU AI Act und die Artefakte, die du vor der Runde bereithalten solltest.

Die Vibe-Code-Production-Readiness-Checkliste

Software Delivery & QA

16. Juni 2026

Die Vibe-Code-Production-Readiness-Checkliste

Eine eigenständige, scannbare Checkliste für jede KI-generierte App, bevor echte User sie anfassen. Zehn Checks nach Häufigkeit sortiert, aufgeteilt in Blocker, High und Cleanup.

Was es kostet, eine vibe-codete App produktionsreif zu machen

Software Delivery & QA

16. Juni 2026

Was kostet es, eine vibe-codete App produktionsreif zu machen?

Aufwandsspannen nach Produkttyp, wo die Zeit tatsächlich hingeht und was ein Audit typischerweise findet, gerahmt als Geld und Timelines. Das Hardening ist der Aufwand, das Audit nennt dir zuerst seine Größe.

Fractional CPO vs Senior Product Manager

Führung & Teams

16. Juni 2026

Fractional CPO vs Senior PM

Was ein Fractional CPO, ein Senior PM und noch-niemand-einstellen jeweils verantworten. Der Weg vom PM zum CPO und warum frühe Gründer meist keinen davon brauchen.

Wann einen Fractional CPO einstellen in Österreich

Führung & Teams

16. Juni 2026

Wann einen Fractional CPO einstellen

Der ehrliche Rahmen. Der Post-PMF-Auslöser, die Bereitschaft des Gründers, die Produktentscheidung abzugeben, wann es scheitert und die Vertragsform freier Dienstvertrag.

Eine einseitige KI-Nutzungsrichtlinie für ein kleines DACH-Unternehmen

Business & Regulierung

15. Juni 2026

Die einseitige KI-Richtlinie fürs DACH-KMU

Dein Team nutzt schon KI. Statt 27 Seiten brauchst du eine Seite, die gelesen wird: freigegebene Tools, Datenregeln, Schulung (EU AI Act Art. 4), menschliche Prüfung, Kennzeichnung, ein Verantwortlicher. Mit kopierfertiger Vorlage.

KI & Agenten

15. Juni 2026

LLM-Token-Kosten 2026 senken

Die Token-Preise sind gefallen, trotzdem laufen agentische Produkte teuer. Der Plan in der richtigen Reihenfolge, Caching, Batching, Routing, das richtige Modell inklusive der chinesischen Open-Weight-Frontier und Kontext-Kompression.

KI & Agenten

14. Juni 2026

KI-Agent-Pilot in 30/60/90 Tagen

Ein realistischer KI-Agent-Rollout dauert rund 90 Tage. Der Plan: abgrenzen und Risiko entschärfen, im Shadow-Modus bauen, begrenzter Produktivbetrieb mit Freigabe-Gates und einer sauberen Übergabe ans Team.

Fractional-CTO-Umsetzungsplan für die ersten 90 Tage in einem Startup

Führung & Teams

13. Juni 2026

Fractional CTO: der 30/60/90-Tage-Plan

Du hast einen Fractional CTO eingestellt. Was sollten die ersten 90 Tage konkret hervorbringen? Einschätzen, planen, umsetzen, und ein laufendes System plus Artefakte hinterlassen, die seinen Weggang überdauern.

KI-MVP-Scope-Vorlage mit Abnahmekriterien, Eval-Set und Launch-Gate

Produkt & MVP

12. Juni 2026

KI-MVP-Scope: Abnahmekriterien, Eval-Set und SoW

'Es funktioniert' ist kein Abnahmekriterium für ein LLM. Vier Dinge gehören in den SoW: Eval-Set, Zielmetrik samt Schwellenwert, Launch-Gate und der unsichere Fall. Mit kopierfertiger Vorlage.

Permissions-First-RAG-Architektur über SharePoint, Confluence und Google Drive

KI & Agenten

11. Juni 2026

RAG über SharePoint, Confluence, Drive: Permissions-First

Das harte Problem in Enterprise-RAG sind die Berechtigungen, nicht die Retrieval-Qualität. So erzwingst du den Zugriff auf der Retrieval-Ebene, trägst ACLs auf jeden Chunk und verhinderst Leaks.

QA für KI-generierten Code, was vor dem Launch bricht

Software Delivery & QA

8. Juni 2026

QA für KI-generierten Code

Was an Code aus Lovable, Cursor, Claude Code und Replit vor dem Launch bricht, und die Production-Readiness-Checkliste, mit der wir es abfangen.

Vom Lovable- und Cursor-Prototyp in Produktion

Software Delivery & QA

8. Juni 2026

Vom Lovable- und Cursor-Prototyp in Produktion: Die Migrations-Checkliste

Zur Demo zu kommen geht schnell. In Produktion zu kommen ist ein eigenes Projekt. Die Checkliste, mit der wir einen KI-IDE-Prototyp härten, Auth, Daten, Secrets, Hosting und die Behalten-oder-neu-bauen-Entscheidung.

Audit von vibe-coded Software, was vor dem Launch bricht

Software Delivery & QA

8. Juni 2026

Audit von Vibe-Coded Software: Was vor dem Launch bricht

Du hast Software ausgeliefert, die du nie gelesen hast. Das ist das strukturierte Lesen, das wir auf KI-generiertem Code fahren, die sieben Dinge, die wir zuerst prüfen, und was den Launch blockiert versus was warten kann.

RAG-Production-Readiness-Checkliste für EU-Unternehmen

KI & Agenten

8. Juni 2026

RAG-Production-Readiness-Checkliste für EU-Unternehmen

Eine RAG-Demo ist einfach. Ein vertrauenswürdiger, unter DSGVO und KI-Verordnung haltbarer, bezahlbarer RAG-Assistent nicht. Die Checks für Retrieval, Grounding, Kosten, Compliance und Sicherheit, die wir vor dem Launch fahren.

MVP-Agenturen in Österreich im Vergleich nach Projektart, Preis, Zeitrahmen und Belegen

Business & Regulierung

8. Juni 2026

MVP-Entwicklung für Startups in Österreich: Anbieter, Kosten und Auswahl 2026

Acht österreichische MVP-Anbieter nach Projektart, öffentlichen Preisen, Zeitrahmen, Standort und Belegen. Mit offengelegtem Eigeninteresse und ohne erfundenen Sieger.

Was ein KI-MVP in Österreich 2026 kostet

Produkt & MVP

8. Juni 2026

Was kostet ein KI-MVP in Österreich 2026?

Ehrliche EUR-Spannen nach Stufe, was die Zahl rauf- oder runtertreibt, die Build/Buy/Fine-Tune-Entscheidung, die vergessenen laufenden Kosten und wie der österreichische Förderstapel den echten Preis verändert.

Wann du Wavect nicht beauftragen solltest

Business & Regulierung

8. Juni 2026

Wann du Wavect nicht beauftragen solltest

Eine ehrliche Liste der sechs Fälle, in denen Wavect die falsche Wahl ist, wen du stattdessen nehmen solltest, und die schmale Art von Arbeit, die wir wirklich am besten können.

Kann ein Software-Studio die Forschungsprämie geltend machen

Business & Regulierung

2. Juni 2026

Kann ein Software-Studio die Forschungsprämie geltend machen?

Die österreichische Forschungsprämie zahlt 14 % der qualifizierten F&E-Kosten bar zurück, auch im Verlust. Welche Dev-Kosten zählen, was die FFG ablehnt und wie sie sich zur deutschen Forschungszulage verhält.

KI & Agenten

1. Juni 2026

Wann lohnt es sich, ein LLM-Eval zu bauen? Kosten, ROI und dem Judge vertrauen

Ein LLM-Eval lohnt sich, wenn Einsatz, Volumen und Häufigkeit der Prompt-Änderungen die Kosten der Harness übersteigen. Die Modellkosten sind ein paar Dollar pro Run; die echten Kosten sind ein Datensatz und ein Judge, dem du vertrauen kannst.

Warum Cross-Chain-Bridges immer wieder leergeräumt werden

Web3 & Datenschutz

31. Mai 2026

Warum Cross-Chain-Bridges immer wieder leergeräumt werden

Ronin, Wormhole und Nomad verloren zusammen über 1,1 Mrd. $. Die Wurzel ist das Vertrauensmodell, nicht der Code. Plus, ob du überhaupt eine Bridge brauchst.

aws Preseed plus FFG plus Forschungspraemie Foerderstack Oesterreich

Business & Regulierung

30. Mai 2026

Wie sich österreichische Startup-Förderung wirklich stapelt

aws Preseed, FFG Basisprogramm und die 14% Forschungsprämie lassen sich legal stapeln, aber das Doppelförderungsverbot saldiert überlappende Euro weg. Caps, ein Rechenbeispiel und die richtige Reihenfolge.

React Native vs Flutter für einen DACH-Gründer, der lokal einstellt

Software Delivery & QA

29. Mai 2026

React Native vs Flutter für einen DACH-Gründer, der lokal einstellen muss

Die Variable, die jeder Vergleich überspringt, ist die Frage, wen du in Innsbruck, Wien, München oder Zürich tatsächlich einstellen kannst. Warum React Native die DACH-Hiring-Rechnung meist für sich entscheidet.

LoRaWAN vs NB-IoT vs Sigfox IoT-Sensor-Pilot-Kosten

Software Delivery & QA

28. Mai 2026

LoRaWAN vs NB-IoT vs Sigfox: So budgetierst du einen IoT-Sensor-Piloten

Eine Entscheidung treibt 80 % deiner Pilot-Kosten, und es ist nicht der Funk. Eigenes Netz, das dir gehört, vs. Carrier-Abo, das du mietest, mit durchgerechnetem TCO-Crossover.

Fokus ist der neue Engpass beim Orchestrieren von AI-Agenten

Führung & Teams

26. Mai 2026

Fokus ist der neue Engpass

LLMs haben den Engpass vom Tippen zum Fokus verschoben. Die Orchestrierungsgrenze, sieben Fehlermuster ab N Agenten und wie wir Agentenanzahl rationieren.

Smart-Contract-Security-Checkliste vor dem externen Audit

Web3 & Datenschutz

26. Mai 2026

Smart Contract Security Checkliste (30 Punkte)

Die 30-Punkte-Checkliste, die wir intern auf Solidity-Code anwenden, bevor er zum externen Auditor geht. Compiler, Access Control, Reentrancy, Gas-Flächen.

Führung & Teams

26. Mai 2026

Fractional-CTO-Tagessätze in Österreich

Ehrliche Tagessatz-Bänder für einen Fractional CTO in Innsbruck, Wien, Linz. Was EUR/Tag wirklich bringt bei Pre-Seed, Seed, Series A und Scale-up.

EU AI Act Compliance-Kosten für ein 5-Personen-Startup

Business & Regulierung

26. Mai 2026

EU AI Act Kosten für ein 5-Personen-Startup

Aufschlüsselung Posten für Posten, EUR 30 bis 80k. Rechtsprüfung, Risikoklassifizierung, technische Dokumentation, Konformitätsbewertung, Data Governance, Post-Market-Monitoring.

Werkvertrag versus Time-and-Material für österreichische SaaS-Gründer

Business & Regulierung

26. Mai 2026

Werkvertrag vs T&M für österreichische SaaS

Wer trägt das Scope-Risiko, wie Abnahme nach ABGB funktioniert, wie die Buchhaltung beides behandelt und wann welches Vertragsmodell für einen österreichischen Build passt.

Produkte ausgeliefert, wie viele gescheitert sind, und die langweilige Mitte

Produkt & MVP

26. Mai 2026

Produkte, die wir ausgeliefert haben. Wie viele gescheitert sind

Aggregierte Outcome-Verteilung über alle von Wavect ausgelieferten Produkte. Wie viele skaliert haben, wie viele eingestellt wurden, wie viele in der langweiligen Mitte landeten.

21 Web3-Mandate und Gas-Kosten im Rückblick

Web3 & Datenschutz

26. Mai 2026

21 Web3-Mandate. Gas-Kosten im Rückblick

Wo Gas-Kosten über 21 Builds tatsächlich angefallen sind und welche Chain wir heute wählen würden. Ethereum, Arbitrum, Optimism, Polygon, Base, Solana im Vergleich.

Scope-Creep-Raten bei Fixed-Price- und T&M-Engagements

Business & Regulierung

26. Mai 2026

Scope-Creep-Raten. Unsere Zahlen

Tatsächliche Häufigkeit von Scope-Änderungen über Fixed-Price- und Time-and-Material-Engagements. Warum ein unterschriebener Werkvertrag-SoW das Feature ist, nicht der Preis.

Wann ein Fractional CTO besser ist als ein Inhouse-CTO in Österreich

Führung & Teams

26. Mai 2026

Wann ein Fractional CTO besser ist als anstellen

Vollkosten Jahr eins für einen Inhouse-Senior-CTO in Österreich versus Fractional-Retainer. Wann jedes Modell gewinnt, wann es falsch ist.

MiCA und FMA Realität für österreichische Web3-Startups 2026

Business & Regulierung

26. Mai 2026

MiCA + FMA Realität Österreich 2026

Engineering-Sicht auf das österreichische Krypto-Regelwerk. CASP-Kategorien, Kapitaluntergrenzen, FMA-Berührungspunkte und die Fragen, die Gründer immer wieder stellen.

DSGVO plus EU AI Act für DACH-SaaS-Gründer

Business & Regulierung

26. Mai 2026

DSGVO + EU AI Act für DACH-SaaS

Der Compliance-Stack für ein 5-Personen-Team. Entscheidungsbaum zu Annex-III-Risiko, plus die Matrix, wer welche Kontrolle verantwortet.

Warum 40 Prozent der AI-Agent-Projekte abgebrochen werden

KI & Agenten

26. Mai 2026

Warum 40% der AI-Agent-Projekte sterben

Acht Muster, die wir bei AI-Agent-Engagements immer wieder sehen. Wie sie aussehen, wie sie das Projekt killen und der billige Fix, wenn man früh dran ist.

RAG versus fine-tuning versus long-context Kosten-Crossover 2026

KI & Agenten

26. Mai 2026

RAG vs Fine-Tuning vs Long-Context 2026

Der Entscheidungsbaum hat sich geändert. Wo die neuen Crossover-Punkte liegen und ein Kostenmodell in EUR für einen 100MB-Korpus bei 10k Queries pro Monat.

LLM-API-Kosten sind 2026 um 80 Prozent gefallen

KI & Agenten

26. Mai 2026

LLM-API-Kosten 2026. Architektur-Shift

Tokens sind jetzt billig. Architektur folgt der Preiskurve. Sieben Moves für 2026, jetzt, wo Context-Windows riesig sind und Routing der Hebel ist.

Ethereum-zu-Solana-Migration Kosten-Teardown

Web3 & Datenschutz

26. Mai 2026

Ethereum-zu-Solana-Migrationskosten

Ehrlicher Teardown einer Ethereum-zu-Solana-Migration. Account-Modell, EVM-zu-SVM-Tooling-Lücke, Indexer-Rebuild, Wallet-UX, Token-Standards, Redeploy-Kosten.

Zero-Knowledge-Proof Use Cases außerhalb von Crypto

Web3 & Datenschutz

26. Mai 2026

Zero-Knowledge außerhalb von Crypto

Sechs Non-Crypto-ZK-Use-Cases. Privacy-preserving KYC, Altersverifikation, Supply-Chain-Provenance, private Credentials, vertrauliche ML-Inferenz.

Account Abstraction ERC-4337 in Produktion

Web3 & Datenschutz

26. Mai 2026

Account Abstraction in Produktion

Sechs Dinge, die ERC-4337 löst, versus sechs Dinge, die es nicht löst. Plus EIP-7702, Bundler-Zentralisierungsrisiko und Paymaster-Ökonomie.

Produkt & MVP

8. September 2024

Der Weg zum Product-Market-Fit

Alle reden über PMF. Fast niemand erreicht ihn. Der schnellste Weg, ihn nie zu finden? Von Anfang an auf die falschen Dinge fokussieren.

Produkt & MVP

2. Juli 2024

Raus aus der Feature-Falle

Die meisten Produkte sterben an zu vielen Features, nicht an zu wenigen. Hier erfährst du, wie du aufhörst alles zu bauen und das eine lieferst, das wirklich zählt.

Software Delivery & QA

29. Juni 2024

Software – ein lebendes Wesen

Software ist nie fertig – trotzdem budgetieren die meisten Unternehmen sie so. So hörst du auf, Geld zu verbrennen, und baust etwas, das Nutzer lieben.

Software Delivery & QA

17. Juni 2024

Warum Test-Driven-Development sich auszahlt

Tests gelten als teuer und langsam. In Wirklichkeit sparen sie dir richtig viel Geld.

Business & Regulierung

7. Juni 2024

Warum Agenturen einen schlechten Ruf haben

Fehlerhafte Software, verpasste Deadlines, unerwartete Rechnungen. Die Horror-Geschichten stimmen – aber das eigentliche Problem liegt woanders.

Business & Regulierung

2. Juni 2024

Software-Projekte richtig kalkulieren

Alle hassen Stundensätze, also verlangen sie Festpreise. Das Problem, Festpreise bei Software-Projekten sind genauso kaputt.

Postfach, ohne Lärm

Folge der Arbeit, die für dich zählt

Du bekommst eine kurze E-Mail, wenn wir etwas Neues veröffentlichen. Folge dem ganzen Blog oder nur den Themen, die dich interessieren.