RAG-Bot fuer Kunden: Von der Idee zur marktfertigen Loesung

5. April 2026

Mit Quellen3 Quellen
3 Min. Lesezeit8 AbschnitteSchneller Einstieg3 Quellen

Worum es geht

Ein RAG-Bot (Retrieval-Augmented Generation) ist 2026 eines der meistgefragten KI-Projekte im Agenturgeschaeft.

Start hier

1Lies zuerst die Einordnung links. Sie erklärt dir, warum der Beitrag überhaupt relevant ist.

2Danach einmal komplett lesen. Der Beitrag ist kurz genug für einen sauberen Durchgang.

3Wenn du tiefer gehen willst, erst am Ende in die Quellen springen.

In diesem Beitrag

Typisches Kundenprojekt: Website-Chatbot mit RAG

Phase 1: Anforderungsaufnahme

Phase 2: Architektur

Phase 3: Aufwandsschaetzung

Ein RAG-Bot (Retrieval-Augmented Generation) ist 2026 eines der meistgefragten KI-Projekte im Agenturgeschaeft. Die Idee ist simpel: Ein Chatbot beantwortet Fragen, aber statt auf Trainings-Wissen zu vertrauen, zieht er Antworten aus einer eigenen Wissensdatenbank - Produktseiten, PDFs, Support-Dokumentation. Fuer Kunden bedeutet das: 24/7-Support, weniger Rueckfragen, mehr Leads. Dieser Artikel beschreibt den typischen Weg von der ersten Kundenanfrage bis zur Uebergabe.

Typisches Kundenprojekt: Website-Chatbot mit RAG

Ein mittelstaendiges SaaS-Unternehmen moechte einen Chatbot auf der Website, der Fragen zu Preisen, Funktionen und Onboarding beantwortet. Gleichzeitig soll er Leads qualifizieren und an das CRM uebergeben.

Dieses Szenario ist repraesentativ: Reale Fallstudien zeigen, dass RAG-Chatbots in solchen Einsaetzen bis zu 45 % weniger Support-Tickets generieren und bis zu 82 % der eingehenden Anfragen automatisch beantworten koennen.

Phase 1: Anforderungsaufnahme

Vor jeder technischen Entscheidung kommen die richtigen Fragen:

  • Welche Dokumente sollen die Wissensbasis bilden? (PDFs, Website, Notion, Confluence?)
  • In welcher Sprache kommuniziert der Bot? Mehrsprachig?
  • Wie viele Anfragen pro Monat werden erwartet?
  • Welche Aktionen soll der Bot ausfuehren koennen? (Nur antworten, oder auch Formulare abschicken, CRM-Eintrag erstellen?)
  • Wo soll der Bot eingebettet werden? (Website-Widget, Slack, WhatsApp?)

Diese Fragen bestimmen Architektur und Budget. Ein Bot, der nur liest, ist wesentlich guenstiger als ein Bot, der handelt.

Phase 2: Architektur

Ein typischer RAG-Stack 2026:

Dokumente --> Chunking --> Embedding --> Vektordatenbank (z.B. Qdrant, Chroma)
                                              |
Nutzerfrage --> Embedding --> Suche in Vektordatenbank
                                              |
                               Top-K relevante Chunks
                                              |
                          LLM (GPT-4o / Claude) + Kontext --> Antwort

Fuer einfache Projekte reicht ein Managed Stack: Botpress, Flowise oder LangChain mit OpenAI und Supabase (pgvector). Fuer anspruchsvollere Anforderungen empfiehlt sich ein selbst-gehosteter Stack mit Qdrant.

Phase 3: Aufwandsschaetzung

Komponente Aufwand
Anforderungsaufnahme + Konzept 3-5h
Datenaufbereitung (Chunking, Cleaning) 4-8h
Backend (Embeddings, Retrieval, API) 8-16h
Frontend (Chat-Widget, Integration) 4-8h
Testing + Prompt-Tuning 4-6h
Dokumentation + Uebergabe 2-3h
Gesamt 25-46h

Typischer Projektpreis: 4.000-9.000 Euro. Bei einfachen Projekten mit No-Code-Tools: 2.000-4.000 Euro.

Was kostet ein RAG-Bot im Betrieb?

Die laufenden Kosten bestehen aus:

  • LLM-API-Kosten: 10-80 Euro/Monat je nach Anfragevolumen
  • Embedding-API: 2-10 Euro/Monat
  • Hosting der Vektordatenbank: 0 Euro (self-hosted) bis 50 Euro/Monat (managed)
  • Server/Container: 5-20 Euro/Monat

Gesamtbetriebskosten fuer einen kleinen Bot: 20-100 Euro/Monat.

Wiederkehrende Einnahmen durch Hosting

Hier liegt der eigentliche Business Case: Wer den Bot betreibt, kann einen Hosting-Retainer verrechnen.

Typische Modelle:

  • Basis-Hosting (eigener Server): 100-200 Euro/Monat
  • Managed Hosting inkl. Updates: 200-400 Euro/Monat
  • Full-Service (Hosting + Support + neue Dokumente einpflegen): 400-800 Euro/Monat

Bei 5 laufenden Kunden: 1.000-4.000 Euro/Monat passiv.

Phase 4: Uebergabe und Dokumentation

Kunden erwarten nach dem Projekt:

  1. Kurze Administrations-Dokumentation: Wie werden neue Dokumente eingepflegt?
  2. Eskalations-Logik: Wann greift ein Mensch ein?
  3. Dashboard oder Log-Zugang: Welche Fragen wurden gestellt, was wurde nicht beantwortet?
  4. Klare SLA: Wer wird kontaktiert, wenn der Bot ausfaellt?

Der letzte Punkt ist oft der Weg zum Retainer.

Fazit

Ein RAG-Bot ist 2026 kein Forschungsprojekt mehr - es ist ein standardisierbares Dienstleistungsprodukt. Wer einen reproduzierbaren Prozess aufbaut, kann mehrere Projekte parallel abwickeln und durch Hosting-Retainer einen wachsenden passiven Anteil aufbauen. Der Einstieg ist mit bestehenden Frameworks und Managed-Diensten auch ohne tiefes ML-Know-how moeglich.

Quellen: How to Build a RAG Chatbot 2026 - Botpress | Top RAG Chatbots for Business - Wonderchat | RAG Customer Support Case Study

Quellen

How to Build a RAG Chatbot 2026 - Botpress

web

Link ↗

Top RAG Chatbots for Business - Wonderchat

web

Link ↗

RAG Customer Support Case Study - Aubergine

web

Link ↗

Hier darfst du aufhören.

Wenn du die Kernidee verstanden hast und einen nächsten Schritt für dich benennen kannst, ist der Beitrag für heute erfüllt. Du musst hier nicht alles in einem Zug durcharbeiten.

War dieser Inhalt hilfreich?