Skip to content
Operate 2. Juni 2026

Was kostet die Entwicklung eines KI-Agenten 2026: echte Preise, Build vs Buy

Was kostet ein maßgeschneiderter KI-Agent 2026 wirklich? Kostentreiber Posten für Posten, Entscheidungsmatrix Build vs Buy vs Konfigurieren, transparente Preise und ein ehrliches FAQ.

Von dp.vision team

Kurz gesagt: Ein maßgeschneiderter KI-Agent kostet typischerweise 28.000–140.000 € für die erste Entwicklung und 4.500–18.000 €/Monat für Betrieb und Wartung — abhängig von Integrationstiefe, Volumen und davon, wie viel menschliche Prüfung der Workflow noch braucht. Doch die meisten Unternehmen kaufen zu groß ein: ein Tool von der Stange für 50–200 €/Monat oder ein konfigurierter Agent für 4.500–28.000 € deckt die Mehrheit der Anwendungsfälle ab. Custom zahlt sich nur aus, wenn der Prozess hochvolumig ist, tief mit Ihren eigenen Systemen verwoben — oder beides. Dieser Artikel geht tief in die Custom-Build-Stufe. Für das vollständige Bild von 0 bis 500.000 € starten Sie mit unserem Leitfaden: KI-Agenten für Unternehmen — Kosten und Einstieg.

„Was kostet es, einen KI-Agenten zu bauen?” ist die falsche erste Frage — aber genau die, die jeder googelt. Die ehrliche Antwort lautet „irgendwo zwischen 0 und 500.000 €”, und das ist nutzlos, solange Sie nicht wissen, welche Stufe Sie eigentlich kaufen.

Dieser Text ist der Deep Dive in die teuerste und am meisten missverstandene Stufe: den maßgeschneiderten Agenten. Wenn Sie bereits entschieden haben, dass Tools von der Stange und No-Code-Plattformen nicht reichen — oder vermuten, dass sie es nicht tun, und das überprüfen wollen, bevor Sie eine sechsstellige Summe ausgeben — dann ist das hier für Sie.

Was „eigener KI-Agent” eigentlich bedeutet

Ein eigener KI-Agent ist Software, die speziell für Ihre Geschäftslogik gebaut, direkt mit Ihren Systemen integriert und in Ihrem Besitz ist — kein Abo eines fremden Produkts.

Um die Stufen präzise zu trennen (vollständig im übergeordneten Leitfaden):

Die Grenze zwischen „konfiguriert” und „custom” ist wichtig, weil der Kostenunterschied grob 5–20x beträgt. Ein Custom-Agent ist gerechtfertigt, wenn:

Trifft nichts davon zu, brauchen Sie mit ziemlicher Sicherheit keinen Custom-Build — und sollten aufhören zu lesen und zuerst ein Tool für 100 €/Monat ausprobieren.

Was den Preis wirklich treibt (Posten für Posten)

Ein Custom-Agent-Angebot ist keine einzelne Zahl. Es ist die Summe mehrerer Kostentreiber, und wo Ihr Projekt innerhalb der Spanne 28.000–140.000 € landet, hängt fast ausschließlich davon ab, welche davon schwer wiegen.

Die Euro-Spannen unten sind allgemeine Branchenschätzungen — typische Muster, die wir und andere Entwickler 2026 sehen, keine festen dp.vision-Preise. Unsere produktisierten Preise stehen im nächsten Abschnitt.

1. Scoping und Discovery (typisch 5–15% der Entwicklung)

Bevor irgendjemand Code schreibt, muss jemand den echten Prozess kartieren — nicht den idealisierten aus dem Handbuch, sondern die unordentliche Version mit Ausnahmen, Sonderfällen und der „ach ja, und manchmal überschreibt Frau Müller aus der Buchhaltung das von Hand”-Regel. Lassen Sie das aus, und Sie bauen einen Agenten, der einen Prozess automatisiert, der gar nicht existiert.

Rechnen Sie mit einer strukturierten Discovery-Phase: Prozesskartierung, Festlegung wo der Agent Befugnis hat und wo ein Mensch freigibt, Erfolgskriterien und eine Messbasis. Als grobe Branchenspanne: Discovery für einen ernsthaften Custom-Build liegt bei 1.500–9.000 € als eigenständige Phase (oft auf die Entwicklung angerechnet).

2. Integrationskomplexität (die größte Einzelvariable)

Hier leben oder sterben Budgets. Einen Agenten an eine gut dokumentierte API mit SDK anzubinden ist günstig. Ihn an fünf Systeme anzubinden — eines mit moderner REST-API, eines das nur nächtliche CSVs exportiert, eines das Screen-Scraping braucht und ein ERP, für das selbst Lesezugriff einen Anbieterberater erfordert — das ist der Moment, in dem Sie 38.000 € statt 14.000 € ausgeben.

Als allgemeine Schätzung: jede saubere Drittanbieter-Integration kostet 1.800–9.000 € zusätzlich; jede Legacy-, undokumentierte oder auth-feindliche Integration kann 9.000–38.000+ € dazulegen. Integration ist meist der größte Einzelposten in jedem ehrlichen Custom-Agent-Angebot.

3. Modell-, API- und Token-Kosten (laufend, nutzungsabhängig)

Das ist der Kostenpunkt, der Leute nach dem Launch überrascht. Sie kaufen nicht „die KI” — Sie mieten sie pro Token, und sie skaliert mit der Nutzung.

2026 werden Frontier-Modelle von Anthropic (Claude), OpenAI (GPT) und Google (Gemini) pro Million Input-/Output-Token berechnet, mit günstigeren „kleinen/schnellen” und teureren „Frontier/Reasoning”-Stufen. Branchenübliche Spannen: ein internes Agentensystem mit niedrigem Volumen kostet vielleicht 50–500 €/Monat an API-Aufrufen; ein kundenorientierter Agent bei echtem Volumen kann 1.000–10.000+ €/Monat verschlingen. (Aktuelle Token-Preise direkt beim Modellanbieter prüfen — sie ändern sich häufig.)

Die wichtigste Regel: kalkulieren Sie Ihre Token-Kosten mit dem 10-fachen Pilotvolumen, bevor Sie sich festlegen. Ein Proof of Concept für 50 €/Monat an API-Aufrufen kann still und leise zu 2.000 €/Monat in der Produktion werden. Ein kleineres Modell für Routineschritte zu wählen und das Frontier-Modell für schwieriges Reasoning zu reservieren ist der Haupthebel, um das zu kontrollieren.

4. Infrastruktur und Hosting (laufend)

Wo der Agent läuft. Ein leichtgewichtiger Agent auf Serverless-Funktionen kostet vielleicht 50–300 €/Monat. Ein Agent, der eine Vektordatenbank für Retrieval, eine Queue für asynchrone Jobs, Logging/Observability und eine Staging-Umgebung braucht, läuft bei 300–2.000+ €/Monat. Self-Hosting (oft der Grund, warum Sie überhaupt auf Custom gegangen sind — Datenschutz) bringt Setup-Kosten und DevOps-Overhead mit, eliminiert aber Per-Aktion-SaaS-Gebühren.

5. Wartung, Monitoring und Iteration (der Posten, den man vergisst)

Ein KI-Agent ist kein „einmal bauen, ewig laufen”-Asset. Modelle werden abgekündigt. APIs ändern sich. Sonderfälle, die in der Discovery niemand vorhergesehen hat, tauchen in Woche drei auf. Die Treffergenauigkeit des Agenten driftet, während sich Ihre Daten und Ihr Geschäft verschieben.

Realistische laufende Wartung sind 15–25% der Entwicklungskosten pro Jahr als allgemeine Branchenfaustregel — abgedeckt sind Monitoring, Prompt-/Logik-Tuning, Abhängigkeits-Updates und die Behandlung neuer Sonderfälle. Planen Sie es ab Tag eins ein, sonst degradiert der Agent still zu etwas, dem Ihr Team nicht mehr vertraut.

Alles zusammen

KostentreiberTypAllgemeine Branchenspanne
Scoping & DiscoveryEinmalig1.500–9.000 €
Entwicklung & IntegrationEinmalig18.000–110.000+ €
Modell / API / TokenLaufend50–10.000+ €/Mon.
Infrastruktur / HostingLaufend50–2.000+ €/Mon.
Wartung & IterationLaufend15–25% der Entwicklung/Jahr

Das sind typische 2026er-Muster, keine Angebote. Die ehrliche Erkenntnis: die anfängliche Entwicklung ist oft nicht die beängstigende Zahl — die laufenden Betriebs- und Wartungskosten entscheiden, ob das Projekt über einen Horizont von 2–3 Jahren Sinn ergibt.

Build vs Buy vs Konfigurieren: die Entscheidungsmatrix

Bevor Sie einen Euro für Custom ausgeben, schicken Sie Ihren Use Case durch diese Tabelle. Die meisten Projekte, die glauben Custom zu brauchen, gehören in die Spalte „Konfigurieren”.

FaktorKaufen (von der Stange)Konfigurieren (No-Code-Plattform)Bauen (Custom)
Anfangskosten0 €4.500–28.000 €28.000–140.000+ €
Laufende Kosten50–300 €/Mon.200–2.000 €/Mon.4.500–18.000 €/Mon.
Zeit bis LiveTage2–6 Wochen6–16+ Wochen
AnpassbarkeitKeine — Roadmap des AnbietersMittel — innerhalb der PlattformgrenzenUnbegrenzt
IntegrationstiefeNur fertige KonnektorenKonnektoren + leichter KlebstoffAlles, auch Legacy/proprietär
DatenschutzDaten gehen zum AnbieterDaten gehen zur PlattformVoll self-hostbar
Wer wartet esAnbieterSie (Konfig) + Anbieter (Plattform)Sie oder Ihr Entwicklungspartner
WechselkostenNiedrig (kündigen)MittelHoch (eigene Codebasis)
Am besten wennÜblicher Bedarf, 80% Genauigkeit reichtSpezifischer Workflow, von der Stange erreicht Ihre Systeme nichtHohes Volumen, proprietäre Logik oder strenge Datenkontrolle

Die Faustregel, die am meisten Geld spart: zuerst kaufen, dann konfigurieren, Custom nur bauen, wenn Sie genau artikulieren können, warum die günstigeren Stufen versagen. „Schön wäre es, das voll custom zu haben” ist kein Grund. „Der Agent muss in unser On-Prem-ERP schreiben, das keine öffentliche API hat, und unsere Compliance verbietet jegliche Datenausleitung aus unserem Netzwerk” ist ein Grund.

Über denselben Instinkt haben wir im Kontext des Softwarebaus überhaupt geschrieben — siehe Vibe Coding vs Studio: wann KI an Grenzen stößt, wo wir erklären, wann DIY-mit-KI wirklich reicht und wann es still mehr kostet als es spart.

Unsere transparenten Preise (der AI-native Benchmark)

Die meisten Custom-Agent-Angebote sind absichtlich undurchsichtig — offenes Discovery, Stundenabrechnung, Scope der aufquillt. Als AI-native Studio produktisieren wir stattdessen, damit Sie die Zahl kennen, bevor Sie sich festlegen. Hier passt Custom-Agent-Arbeit in unsere Preise:

Warum ist das oft weniger als ein Angebot einer klassischen Softwareagentur für dasselbe Ergebnis? Weil das AI-native Betriebsmodell strukturell günstiger zu betreiben ist — kleinere, ausschließlich seniorbesetzte Teams, KI-beschleunigte Build-Pipelines, keine Schichten von Account- und Projektmanagern, die Meetings über Meetings abrechnen. Wir schlüsseln das genau auf in KI-Studio vs traditionelle Agentur. Die Ersparnis zeigt sich im Preis, nicht in der Marge.

Vollständige Zahlen über alle Leistungen finden Sie auf der Preisseite.

ROI-Einordnung (ohne erfundene Zahlen)

Wir verkaufen Ihnen keinen falschen „3,2-Monats-Payback” — Ihre Zahlen sind Ihre. Aber die Rechnung, die Sie selbst aufmachen sollten, ist einfach und qualitativ:

  1. Erfassen Sie die aktuellen Kosten. Wie viele Stunden pro Monat frisst dieser Prozess, zu welchen vollen internen Kosten? Was kostet jeder Fehler, der durchrutscht? Sie können keine Verbesserung an einer Zahl messen, die Sie nie aufgeschrieben haben.
  2. Schätzen Sie die Abdeckung des Agenten, nicht Perfektion. Ein Custom-Agent schafft selten 100%. Wenn er zuverlässig 70–80% bewältigt und den Rest an einen Menschen routet, ist das ein Gewinn — sofern die 70–80% der teure, repetitive Teil sind.
  3. Nutzen Sie das volle TCO, nicht nur die Entwicklung. Gesamtkosten = Entwicklung + (monatlicher Betrieb und Wartung × Ihr Horizont). Vergleichen Sie das mit den Basiskosten über denselben Zeitraum — typisch 2–3 Jahre.
  4. Gewichten Sie den nicht-monetären Wert. Schnellere Durchlaufzeiten, weniger menschliche Fehler auf kritischen Pfaden, freigesetzte Kapazität für höherwertige Arbeit und Prozesse, die nicht zusammenbrechen, wenn jemand in den Urlaub geht. Das ist real, auch wenn es schwer auf eine einzelne Zahl zu bringen ist.

Die ehrliche Version: Wenn Sie diese Rechnung nicht auf einem Bierdeckel skizzieren und einen klaren Gewinn sehen können, ist das Projekt vermutlich nicht reif — und ein Tool für 100 €/Monat zum Testen der Prämisse ist der klügere nächste Schritt.

Ein typischer Fehlermodus, den man benennen sollte

Der teuerste Einzelfehler in diesem Feld ist, Custom zu bauen, wenn Konfigurieren 80% der Arbeit erledigt hätte. Ein Custom-Wissensdatenbank-Agent für 50.000 € ist selten besser als ein konfigurierter für 5.000 € — es sei denn, Ihre Daten sind wirklich proprietär und komplex. Der zweitteuerste Fehler ist, einen kaputten Prozess zu automatisieren — ein Agent führt Chaos schneller aus als Menschen, repariert es aber nicht. Reparieren Sie den Prozess, dann automatisieren Sie ihn.

Deshalb ist unser Standardvorgehen mit Kunden, eng zu starten: eine schmerzhafte, repetitive, ein-bisschen-aber-nicht-null-Urteilskraft erfordernde Aufgabe, schnell ausgerollt, ehrlich gemessen. Eskalation zu Custom erst, wenn die günstigere Stufe nachweislich nicht reicht.

FAQ

Wie hoch sind die Gesamtbetriebskosten (TCO) eines eigenen KI-Agenten? Einmal bauen, ewig betreiben — nur ist „betreiben” nicht kostenlos. Als 3-Jahres-Skizze: einmalige Entwicklung (28.000–140.000 €) + laufender Betrieb und Wartung (Modell/API + Infrastruktur + 15–25% der Entwicklung pro Jahr für Wartung). Bei vielen Agenten mittlerer Komplexität erreichen oder übersteigen die 3-Jahres-Betriebskosten die ursprüngliche Entwicklung. Bewerten Sie immer nach TCO, nicht nach dem Preisschild der Entwicklung.

Open-Source-Modelle vs Claude/GPT/Gemini — was ist günstiger? Kommt auf Volumen und Betriebsort an. Kommerzielle Frontier-Modelle (Claude, GPT, Gemini) berechnen pro Token und erfordern keine eigene Infrastruktur — am günstigsten bei niedrigem bis mittlerem Volumen und beste Qualität bei schwierigem Reasoning. Open-Source/Open-Weight-Modelle (Llama, Mistral und ähnliche) haben beim Self-Hosting keine Per-Token-API-Gebühr, aber Sie zahlen für die GPU-Infrastruktur und das Engineering zum Betreiben, Skalieren und Warten — was die kommerziellen Preise erst bei hohem, stabilem Volumen schlägt oder wenn Datenschutz Self-Hosting erfordert. Für die meisten Unternehmen, die ihren ersten Custom-Agenten bauen, ist ein kommerzielles Modell der schnellere, risikoärmere Start; Self-Hosting wieder aufgreifen, sobald Volumen und Anforderungen den operativen Overhead rechtfertigen. (Aktuelle Token- und GPU-Preise direkt bei den Anbietern prüfen — die Tarife bewegen sich schnell.)

Wer wartet den Agenten nach der Entwicklung? Wer auch immer Sie entscheiden — und Sie sollten vor dem Bauen entscheiden. Drei Optionen: (1) Ihr internes Team, was jemanden erfordert, der sowohl die Codebasis als auch das Modellverhalten versteht; (2) Ihr Entwicklungspartner im Retainer (unser KI-Operations-Retainer, ab 4.500 €/Mon.); oder (3) ein Hybrid, bei dem der Partner Modell/Infrastruktur übernimmt und Sie die Geschäftslogik. Die einzige Option, die scheitert, ist „niemand” — ungewartete Agenten driften, brechen bei API-Änderungen und verlieren still das Vertrauen Ihres Teams.

Wie lange dauert die Entwicklung eines KI-Agenten? Ein eng abgegrenzter Agent liefert in Wochen, nicht Monaten — unser 30-Tage-Automatisierungsprogramm zielt bewusst auf 30 Tage bis zu einer echten, ausgerollten Automatisierung. Größere Custom-Systeme oder AI-native Produkte (Multi-Agent, schwere Integration) laufen 6–16+ Wochen. Das größte Zeitrisiko ist nicht die KI — es ist der Integrationszugang. Zugangsdaten und Lese-/Schreibzugriff auf Ihre eigenen Legacy-Systeme zu bekommen ist häufig der längste Hebel. Klären Sie das in der Discovery, nicht in Woche sechs.

Brauche ich wirklich einen eigenen Agenten oder kaufe ich zu groß ein? Grundannahme: Sie kaufen zu groß ein. Schicken Sie Ihren Use Case durch die obige Build-vs-Buy-vs-Konfigurieren-Matrix. Wenn ein Tool von der Stange oder ein konfigurierter No-Code-Agent Ihre Systeme erreicht und ~70% der Aufgabe schafft, starten Sie dort — Tage bis zum Rollout und ein Bruchteil der Kosten. Custom ist die richtige Wahl nur, wenn proprietäre Logik, tiefe Integration, strenge Datenkontrolle oder hohes Volumen die günstigeren Stufen tatsächlich ausschließen.

Wo anfangen

Beginnen Sie nicht damit, ein Custom-Build-Angebot einzuholen. Beginnen Sie damit, die Prämisse günstig zu beweisen: wählen Sie die eine repetitive, urteilskraftfordernde Aufgabe, die Ihr Team die meisten Stunden kostet, testen Sie sie mit einem Tool von der Stange oder einem konfigurierten Tool und messen Sie. Wenn — und nur wenn — das an eine Wand stößt, die Ihr Geschäft nicht akzeptieren kann, dann verdient Custom seinen Platz.

Wenn Sie an diesem Punkt sind, ist unser 30-Tage-Automatisierungsprogramm der schnellste Weg zu einem echten, eigenen Agenten, und der KI-Operations-Retainer hält ihn nach dem Launch gesund. Wenn der Agent das Produkt ist, baut 0 → MVP das Ganze.

Für das vollständige Bild von 0 bis 500.000 € über alle Agentenstufen lesen Sie den übergeordneten Leitfaden: KI-Agenten für Unternehmen: was sie kosten, was sie können und wo anfangen. Dann erzählen Sie uns von dem Prozess, der die Zeit Ihres Teams frisst, und wir sagen Ihnen ehrlich, ob er einen Custom-Agenten braucht — oder ein Tool für 100 €.

Bereit, Ihr Projekt zu starten?

Lassen Sie uns darüber sprechen, wie dp.vision Ihnen helfen kann — Markenaufbau, Webentwicklung, Automatisierung — mit AI-nativer Geschwindigkeit.