Meinungen, keine Pressemitteilungen
Pro Token günstiger. Pro Antwort teurer.
Sonnet 5 startete pro Token günstiger als Opus 4.8, kostete im vollständigen Benchmark aber mehr pro erledigter Aufgabe. Warum Cost per Task, nicht der Preis pro Token, die Zahl auf deiner Rechnung ist.
Fable ist zurück. So codest du wirklich damit.
Fable 5 ist wieder da, hinter strengeren Classifiern, die manchmal auf Opus 4.8 zurückfallen. Nutze es nicht wie Autocomplete: nutze es für Architektur, Migrationsplanung und finalen Review, und route den Rest an günstigere Modelle.
Dario hat Open Source den Krieg erklärt. Der echte Krieg geht um deine KI-Rechnung.
Anthropic warf chinesischen Laboren vor, seine Modelle gestohlen zu haben, und bat Washington um Eingreifen. Streiche die Geopolitik, und es ist ein Kampf um den Preis von Intelligenz. Coinbase hat seine KI-Rechnung mit Open Weights und Routing bereits um 50 % gesenkt. Unsere Lesart, und die EU-Absicherung.
Agile De-Engineering
Wie eine Bewegung zur Befreiung von Engineers die Engineering-Kultur im Enterprise aushöhlte. Alexandre Kotcherguine und Kevin Riedl zeichnen Kommerzialisierung, Ritual Capture, Metrikumkehr und die Erosion des Handwerks nach.
Was ein interner KI-Assistent in der DACH-Region wirklich kostet (2026)
Embeddings, Vektor-DB, Tokens, Hosting und die Wartungszeile, die alle vergessen. Eine Richtwert-Kostenaufstellung pro Sitz für einen internen DACH-KI-Assistenten.
Das MVP ist tot. Bau ein Minimum Credible Product.
KI macht Prototypen billig, nicht Produktentscheidungen. Die Rauheit des klassischen MVP beschädigt heute oft genau das Signal, das es sammeln soll. Ein Plädoyer für weniger Scope, einen vertrauenswürdigen Kernpfad und belastbare Evidenz.
LLM-Gateways im Vergleich 2026: LiteLLM vs OpenRouter vs Portkey vs RouteLLM
Ein Endpoint über viele Provider, mit Fallback, Caching, Spend-Limits und Routing an einem Ort. Wie sich LiteLLM, OpenRouter, Portkey und RouteLLM unterscheiden, und wie du nach der Einschränkung wählst, die dich bindet.
LLMs in der EU selbst hosten: Wann sich Open Weights wirklich rechnen
Die GPU ist der günstige Teil. Hier sind die echten Kosten von Self-Hosting, der Token-pro-Tag-Break-even gegen Hosted APIs, wann Datenresidenz dich zwingt, und der vLLM-Produktions-Stack.
Open-Weight-LLM-Showdown 2026: DeepSeek vs Qwen vs Kimi vs GLM vs Llama
DeepSeek, Qwen, Kimi K2, GLM und Llama im Vergleich: Preis, Coding- und Reasoning-Qualität, Kontextfenster, Lizenz und EU-Self-Host, plus die Entscheidungsreihenfolge, die wir vor einem Modell-Deployment fahren.
KI-Beratung Österreich 2026: der ehrliche Guide
Strategie, Workshop, Automation, RAG, Copilot oder Custom Agent? Ehrliche Kosten, echte Use Cases, Förderung und der aktuelle Stand zum EU AI Act für KMU. Stand Mitte 2026.
Der Engpass war nie Intelligenz. Es war Kontext.
Rakuten ließ einen Coding-Agenten sieben Stunden auf vLLM mit 99,9% Genauigkeit laufen. Die eigentliche Lektion sind nicht die Stunden. Es ist, dass Kontext, nicht Intelligenz, der Engpass war, und dass das Steuern von Agenten zur neuen Deep Work wurde.
ChatGPT Enterprise vs. Copilot vs. eigenes RAG
Copilot, wenn du in M365 lebst. ChatGPT Enterprise für verteilte Daten. Eigenes RAG nur für volle Kontrolle. Keines ist allein DSGVO-konform, du bleibst der Verantwortliche. Stand Mitte 2026.
EU-Datenresidenz für KI-Apps 2026
OpenAI, Azure, Mistral, Hetzner oder Self-Hosting? Die Falle, die fast jeder übersieht: EU-Datenresidenz meint meist Speicherung in der EU, nicht dass das Modell in der EU läuft.
Due Diligence für Lovable-, Bolt- und Replit-Apps
Bevor du auf einer KI-gebauten App eine Runde aufnimmst oder verkaufst, entscheiden drei Fragen: Ist sie sicher, gehört sie dir, ist sie wartbar? Die Checkliste für Sicherheit, IP und Investorenreife.
KI-Förderung Österreich 2026: aws, FFG, Forschungsprämie
Die vier Wege zur KI-Förderung in Österreich 2026, ehrlich eingeordnet: aws fürs Einführen, FFG fürs Forschen, 14 Prozent Forschungsprämie, KMU.DIGITAL. Plus der Haken: offene Calls und Budget.
KI 2026 intern ausrollen
Die meisten internen KI-Rollouts bleiben als Shelfware stecken. Die Reihenfolge, die wir anwenden: das Team bilden, den echten Prozess mappen, Kosten und Compliance klären, einen Workflow in Produktion bringen, dann übergeben, damit dein Team ihn besitzt.
MCP vs RAG vs Agent Skills vs Custom GPTs
Keine vier Antworten auf eine Frage, sondern vier Schichten: RAG für Wissen, MCP für Anbindung, Skills für Prozedur, Custom GPTs als verpackte Fläche. Ein Entscheidungsbaum, plus warum du sie meist kombinierst.
Fractional CTPO vs CTO und CPO
Wann ein kombinierter Kopf für Produkt und Technik das getrennte Einstellen von Fractional CTO und CPO schlägt, der Acht-Entwickler-Split-Punkt und der Single-Point-of-Failure-Trade-off.
Technische Due Diligence für KI-MVPs vor der Finanzierung
Welche KI-spezifischen Punkte Investoren bei einem KI-MVP prüfen: Evals als Nachweis, Versionierung, Inferenzkosten, Datenrechte, EU AI Act und die Artefakte, die du vor der Runde bereithalten solltest.
Die Vibe-Code-Production-Readiness-Checkliste
Eine eigenständige, scannbare Checkliste für jede KI-generierte App, bevor echte User sie anfassen. Zehn Checks nach Häufigkeit sortiert, aufgeteilt in Blocker, High und Cleanup.
Was kostet es, eine vibe-codete App produktionsreif zu machen?
Aufwandsspannen nach Produkttyp, wo die Zeit tatsächlich hingeht und was ein Audit typischerweise findet, gerahmt als Geld und Timelines. Das Hardening ist der Aufwand, das Audit nennt dir zuerst seine Größe.
Fractional CPO vs Senior PM
Was ein Fractional CPO, ein Senior PM und noch-niemand-einstellen jeweils verantworten. Der Weg vom PM zum CPO und warum frühe Gründer meist keinen davon brauchen.
Wann einen Fractional CPO einstellen
Der ehrliche Rahmen. Der Post-PMF-Auslöser, die Bereitschaft des Gründers, die Produktentscheidung abzugeben, wann es scheitert und die Vertragsform freier Dienstvertrag.
Die einseitige KI-Richtlinie fürs DACH-KMU
Dein Team nutzt schon KI. Statt 27 Seiten brauchst du eine Seite, die gelesen wird: freigegebene Tools, Datenregeln, Schulung (EU AI Act Art. 4), menschliche Prüfung, Kennzeichnung, ein Verantwortlicher. Mit kopierfertiger Vorlage.
LLM-Token-Kosten 2026 senken
Die Token-Preise sind gefallen, trotzdem laufen agentische Produkte teuer. Der Plan in der richtigen Reihenfolge, Caching, Batching, Routing, das richtige Modell inklusive der chinesischen Open-Weight-Frontier und Kontext-Kompression.
KI-Agent-Pilot in 30/60/90 Tagen
Ein realistischer KI-Agent-Rollout dauert rund 90 Tage. Der Plan: abgrenzen und Risiko entschärfen, im Shadow-Modus bauen, begrenzter Produktivbetrieb mit Freigabe-Gates und einer sauberen Übergabe ans Team.
Fractional CTO: der 30/60/90-Tage-Plan
Du hast einen Fractional CTO eingestellt. Was sollten die ersten 90 Tage konkret hervorbringen? Einschätzen, planen, umsetzen, und ein laufendes System plus Artefakte hinterlassen, die seinen Weggang überdauern.
KI-MVP-Scope: Abnahmekriterien, Eval-Set und SoW
'Es funktioniert' ist kein Abnahmekriterium für ein LLM. Vier Dinge gehören in den SoW: Eval-Set, Zielmetrik samt Schwellenwert, Launch-Gate und der unsichere Fall. Mit kopierfertiger Vorlage.
RAG über SharePoint, Confluence, Drive: Permissions-First
Das harte Problem in Enterprise-RAG sind die Berechtigungen, nicht die Retrieval-Qualität. So erzwingst du den Zugriff auf der Retrieval-Ebene, trägst ACLs auf jeden Chunk und verhinderst Leaks.
QA für KI-generierten Code
Was an Code aus Lovable, Cursor, Claude Code und Replit vor dem Launch bricht, und die Production-Readiness-Checkliste, mit der wir es abfangen.
Vom Lovable- und Cursor-Prototyp in Produktion: Die Migrations-Checkliste
Zur Demo zu kommen geht schnell. In Produktion zu kommen ist ein eigenes Projekt. Die Checkliste, mit der wir einen KI-IDE-Prototyp härten, Auth, Daten, Secrets, Hosting und die Behalten-oder-neu-bauen-Entscheidung.
Audit von Vibe-Coded Software: Was vor dem Launch bricht
Du hast Software ausgeliefert, die du nie gelesen hast. Das ist das strukturierte Lesen, das wir auf KI-generiertem Code fahren, die sieben Dinge, die wir zuerst prüfen, und was den Launch blockiert versus was warten kann.
RAG-Production-Readiness-Checkliste für EU-Unternehmen
Eine RAG-Demo ist einfach. Ein vertrauenswürdiger, unter DSGVO und KI-Verordnung haltbarer, bezahlbarer RAG-Assistent nicht. Die Checks für Retrieval, Grounding, Kosten, Compliance und Sicherheit, die wir vor dem Launch fahren.
Beste Softwareagenturen in Österreich für KI-MVPs und Startups (2026)
Die eine beste Softwareagentur in Österreich gibt es nicht. Ein ehrlicher, fairer Gründer-Leitfaden, um die richtige Kategorie für deine Phase, dein Budget und deine KI-Zentralität zu wählen, plus zehn Fragen vor der Unterschrift.
Was kostet ein KI-MVP in Österreich 2026?
Ehrliche EUR-Spannen nach Stufe, was die Zahl rauf- oder runtertreibt, die Build/Buy/Fine-Tune-Entscheidung, die vergessenen laufenden Kosten und wie der österreichische Förderstapel den echten Preis verändert.
Wann du Wavect nicht beauftragen solltest
Eine ehrliche Liste der sechs Fälle, in denen Wavect die falsche Wahl ist, wen du stattdessen nehmen solltest, und die schmale Art von Arbeit, die wir wirklich am besten können.
Kann ein Software-Studio die Forschungsprämie geltend machen?
Die österreichische Forschungsprämie zahlt 14 % der qualifizierten F&E-Kosten bar zurück, auch im Verlust. Welche Dev-Kosten zählen, was die FFG ablehnt und wie sie sich zur deutschen Forschungszulage verhält.
Wann lohnt es sich, ein LLM-Eval zu bauen? Kosten, ROI und dem Judge vertrauen
Ein LLM-Eval lohnt sich, wenn Einsatz, Volumen und Häufigkeit der Prompt-Änderungen die Kosten der Harness übersteigen. Die Modellkosten sind ein paar Dollar pro Run; die echten Kosten sind ein Datensatz und ein Judge, dem du vertrauen kannst.
Warum Cross-Chain-Bridges immer wieder leergeräumt werden
Ronin, Wormhole und Nomad verloren zusammen über 1,1 Mrd. $. Die Wurzel ist das Vertrauensmodell, nicht der Code. Plus, ob du überhaupt eine Bridge brauchst.
Wie sich österreichische Startup-Förderung wirklich stapelt
aws Preseed, FFG Basisprogramm und die 14% Forschungsprämie lassen sich legal stapeln, aber das Doppelförderungsverbot saldiert überlappende Euro weg. Caps, ein Rechenbeispiel und die richtige Reihenfolge.
React Native vs Flutter für einen DACH-Gründer, der lokal einstellen muss
Die Variable, die jeder Vergleich überspringt, ist die Frage, wen du in Innsbruck, Wien, München oder Zürich tatsächlich einstellen kannst. Warum React Native die DACH-Hiring-Rechnung meist für sich entscheidet.
LoRaWAN vs NB-IoT vs Sigfox: So budgetierst du einen IoT-Sensor-Piloten
Eine Entscheidung treibt 80 % deiner Pilot-Kosten, und es ist nicht der Funk. Eigenes Netz, das dir gehört, vs. Carrier-Abo, das du mietest, mit durchgerechnetem TCO-Crossover.
Fokus ist der neue Engpass
LLMs haben den Engpass vom Tippen zum Fokus verschoben. Die Orchestrierungsgrenze, sieben Fehlermuster ab N Agenten und wie wir Agentenanzahl rationieren.
Smart Contract Security Checkliste (30 Punkte)
Die 30-Punkte-Checkliste, die wir intern auf Solidity-Code anwenden, bevor er zum externen Auditor geht. Compiler, Access Control, Reentrancy, Gas-Flächen.
Fractional-CTO-Tagessätze in Österreich
Ehrliche Tagessatz-Bänder für einen Fractional CTO in Innsbruck, Wien, Linz. Was EUR/Tag wirklich bringt bei Pre-Seed, Seed, Series A und Scale-up.
EU AI Act Kosten für ein 5-Personen-Startup
Aufschlüsselung Posten für Posten, EUR 30 bis 80k. Rechtsprüfung, Risikoklassifizierung, technische Dokumentation, Konformitätsbewertung, Data Governance, Post-Market-Monitoring.
Werkvertrag vs T&M für österreichische SaaS
Wer trägt das Scope-Risiko, wie Abnahme nach ABGB funktioniert, wie die Buchhaltung beides behandelt und wann welches Vertragsmodell für einen österreichischen Build passt.
Produkte, die wir ausgeliefert haben. Wie viele gescheitert sind
Aggregierte Outcome-Verteilung über alle von Wavect ausgelieferten Produkte. Wie viele skaliert haben, wie viele eingestellt wurden, wie viele in der langweiligen Mitte landeten.
21 Web3-Mandate. Gas-Kosten im Rückblick
Wo Gas-Kosten über 21 Builds tatsächlich angefallen sind und welche Chain wir heute wählen würden. Ethereum, Arbitrum, Optimism, Polygon, Base, Solana im Vergleich.
Scope-Creep-Raten. Unsere Zahlen
Tatsächliche Häufigkeit von Scope-Änderungen über Fixed-Price- und Time-and-Material-Engagements. Warum ein unterschriebener Werkvertrag-SoW das Feature ist, nicht der Preis.
Wann ein Fractional CTO besser ist als anstellen
Vollkosten Jahr eins für einen Inhouse-Senior-CTO in Österreich versus Fractional-Retainer. Wann jedes Modell gewinnt, wann es falsch ist.
MiCA + FMA Realität Österreich 2026
Engineering-Sicht auf das österreichische Krypto-Regelwerk. CASP-Kategorien, Kapitaluntergrenzen, FMA-Berührungspunkte und die Fragen, die Gründer immer wieder stellen.
DSGVO + EU AI Act für DACH-SaaS
Der Compliance-Stack für ein 5-Personen-Team. Entscheidungsbaum zu Annex-III-Risiko, plus die Matrix, wer welche Kontrolle verantwortet.
Warum 40% der AI-Agent-Projekte sterben
Acht Muster, die wir bei AI-Agent-Engagements immer wieder sehen. Wie sie aussehen, wie sie das Projekt killen und der billige Fix, wenn man früh dran ist.
RAG vs Fine-Tuning vs Long-Context 2026
Der Entscheidungsbaum hat sich geändert. Wo die neuen Crossover-Punkte liegen und ein Kostenmodell in EUR für einen 100MB-Korpus bei 10k Queries pro Monat.
LLM-API-Kosten 2026. Architektur-Shift
Tokens sind jetzt billig. Architektur folgt der Preiskurve. Sieben Moves für 2026, jetzt, wo Context-Windows riesig sind und Routing der Hebel ist.
Ethereum-zu-Solana-Migrationskosten
Ehrlicher Teardown einer Ethereum-zu-Solana-Migration. Account-Modell, EVM-zu-SVM-Tooling-Lücke, Indexer-Rebuild, Wallet-UX, Token-Standards, Redeploy-Kosten.
Zero-Knowledge außerhalb von Crypto
Sechs Non-Crypto-ZK-Use-Cases. Privacy-preserving KYC, Altersverifikation, Supply-Chain-Provenance, private Credentials, vertrauliche ML-Inferenz.
Account Abstraction in Produktion
Sechs Dinge, die ERC-4337 löst, versus sechs Dinge, die es nicht löst. Plus EIP-7702, Bundler-Zentralisierungsrisiko und Paymaster-Ökonomie.
Software-Projekte richtig kalkulieren
Alle hassen Stundensätze, also verlangen sie Festpreise. Das Problem, Festpreise bei Software-Projekten sind genauso kaputt.
Warum Agenturen einen schlechten Ruf haben
Fehlerhafte Software, verpasste Deadlines, unerwartete Rechnungen. Die Horror-Geschichten stimmen – aber das eigentliche Problem liegt woanders.
Warum Test-Driven-Development sich auszahlt
Tests gelten als teuer und langsam. In Wirklichkeit sparen sie dir richtig viel Geld.
Software – ein lebendes Wesen
Software ist nie fertig – trotzdem budgetieren die meisten Unternehmen sie so. So hörst du auf, Geld zu verbrennen, und baust etwas, das Nutzer lieben.
Raus aus der Feature-Falle
Die meisten Produkte sterben an zu vielen Features, nicht an zu wenigen. Hier erfährst du, wie du aufhörst alles zu bauen und das eine lieferst, das wirklich zählt.
Der Weg zum Product-Market-Fit
Alle reden über PMF. Fast niemand erreicht ihn. Der schnellste Weg, ihn nie zu finden? Von Anfang an auf die falschen Dinge fokussieren.
