RAG-Bot fuer Kunden: Von der Idee zur marktfertigen Loesung

Ein RAG-Bot (Retrieval-Augmented Generation) ist 2026 eines der meistgefragten KI-Projekte im Agenturgeschaeft. Die Idee ist simpel: Ein Chatbot beantwortet Fragen, aber statt auf Trainings-Wissen zu vertrauen, zieht er Antworten aus einer eigenen Wissensdatenbank - Produktseiten, PDFs, Support-Dokumentation. Fuer Kunden bedeutet das: 24/7-Support, weniger Rueckfragen, mehr Leads. Dieser Artikel beschreibt den typischen Weg von der ersten Kundenanfrage bis zur Uebergabe.

Typisches Kundenprojekt: Website-Chatbot mit RAG

Ein mittelstaendiges SaaS-Unternehmen moechte einen Chatbot auf der Website, der Fragen zu Preisen, Funktionen und Onboarding beantwortet. Gleichzeitig soll er Leads qualifizieren und an das CRM uebergeben.

Dieses Szenario ist repraesentativ: Reale Fallstudien zeigen, dass RAG-Chatbots in solchen Einsaetzen bis zu 45 % weniger Support-Tickets generieren und bis zu 82 % der eingehenden Anfragen automatisch beantworten koennen.

Phase 1: Anforderungsaufnahme

Vor jeder technischen Entscheidung kommen die richtigen Fragen:

Welche Dokumente sollen die Wissensbasis bilden? (PDFs, Website, Notion, Confluence?)
In welcher Sprache kommuniziert der Bot? Mehrsprachig?
Wie viele Anfragen pro Monat werden erwartet?
Welche Aktionen soll der Bot ausfuehren koennen? (Nur antworten, oder auch Formulare abschicken, CRM-Eintrag erstellen?)
Wo soll der Bot eingebettet werden? (Website-Widget, Slack, WhatsApp?)

Diese Fragen bestimmen Architektur und Budget. Ein Bot, der nur liest, ist wesentlich guenstiger als ein Bot, der handelt.

Phase 2: Architektur

Ein typischer RAG-Stack 2026:

Dokumente --> Chunking --> Embedding --> Vektordatenbank (z.B. Qdrant, Chroma)
                                              |
Nutzerfrage --> Embedding --> Suche in Vektordatenbank
                                              |
                               Top-K relevante Chunks
                                              |
                          LLM (GPT-4o / Claude) + Kontext --> Antwort

Fuer einfache Projekte reicht ein Managed Stack: Botpress, Flowise oder LangChain mit OpenAI und Supabase (pgvector). Fuer anspruchsvollere Anforderungen empfiehlt sich ein selbst-gehosteter Stack mit Qdrant.

Phase 3: Aufwandsschaetzung

Komponente	Aufwand
Anforderungsaufnahme + Konzept	3-5h
Datenaufbereitung (Chunking, Cleaning)	4-8h
Backend (Embeddings, Retrieval, API)	8-16h
Frontend (Chat-Widget, Integration)	4-8h
Testing + Prompt-Tuning	4-6h
Dokumentation + Uebergabe	2-3h
Gesamt	25-46h

Typischer Projektpreis: 4.000-9.000 Euro. Bei einfachen Projekten mit No-Code-Tools: 2.000-4.000 Euro.

Was kostet ein RAG-Bot im Betrieb?

Die laufenden Kosten bestehen aus:

LLM-API-Kosten: 10-80 Euro/Monat je nach Anfragevolumen
Embedding-API: 2-10 Euro/Monat
Hosting der Vektordatenbank: 0 Euro (self-hosted) bis 50 Euro/Monat (managed)
Server/Container: 5-20 Euro/Monat

Gesamtbetriebskosten fuer einen kleinen Bot: 20-100 Euro/Monat.

Wiederkehrende Einnahmen durch Hosting

Hier liegt der eigentliche Business Case: Wer den Bot betreibt, kann einen Hosting-Retainer verrechnen.

Typische Modelle:

Basis-Hosting (eigener Server): 100-200 Euro/Monat
Managed Hosting inkl. Updates: 200-400 Euro/Monat
Full-Service (Hosting + Support + neue Dokumente einpflegen): 400-800 Euro/Monat

Bei 5 laufenden Kunden: 1.000-4.000 Euro/Monat passiv.

Phase 4: Uebergabe und Dokumentation

Kunden erwarten nach dem Projekt:

Kurze Administrations-Dokumentation: Wie werden neue Dokumente eingepflegt?
Eskalations-Logik: Wann greift ein Mensch ein?
Dashboard oder Log-Zugang: Welche Fragen wurden gestellt, was wurde nicht beantwortet?
Klare SLA: Wer wird kontaktiert, wenn der Bot ausfaellt?

Der letzte Punkt ist oft der Weg zum Retainer.

Fazit

Ein RAG-Bot ist 2026 kein Forschungsprojekt mehr - es ist ein standardisierbares Dienstleistungsprodukt. Wer einen reproduzierbaren Prozess aufbaut, kann mehrere Projekte parallel abwickeln und durch Hosting-Retainer einen wachsenden passiven Anteil aufbauen. Der Einstieg ist mit bestehenden Frameworks und Managed-Diensten auch ohne tiefes ML-Know-how moeglich.

Quellen: How to Build a RAG Chatbot 2026 - Botpress | Top RAG Chatbots for Business - Wonderchat | RAG Customer Support Case Study

RAG-Bot fuer Kunden: Von der Idee zur marktfertigen Loesung

Worum es geht

Start hier

In diesem Beitrag