Web Scraping mit n8n und Firecrawl: Daten automatisch extrahieren

5. April 2026

Mit Quellen3 Quellen
2 Min. Lesezeit8 AbschnitteSchneller Einstieg3 Quellen

Worum es geht

Firecrawl ist seit 2025 eine native Integration in n8n — kein manuelles API-Key-Management, kein Code.

Start hier

1Lies zuerst die Einordnung links. Sie erklärt dir, warum der Beitrag überhaupt relevant ist.

2Danach einmal komplett lesen. Der Beitrag ist kurz genug für einen sauberen Durchgang.

3Wenn du tiefer gehen willst, erst am Ende in die Quellen springen.

In diesem Beitrag

Was ist Firecrawl?

Einrichtung in n8n

n8n Cloud (empfohlen)

Self-Hosted n8n

Firecrawl ist seit 2025 eine native Integration in n8n — kein manuelles API-Key-Management, kein Code. Du verbindest den Node per Klick und hast sofort Zugriff auf Web-Scraping, Crawling und KI-gestuetzte Datenextraktion.

Was ist Firecrawl?

Firecrawl ist ein Web-Scraping-Dienst der speziell fuer KI-Workflows entwickelt wurde. Anders als klassische Scraper liefert er sauberes Markdown statt rohem HTML — ideal als Input fuer LLMs.

Kernfunktionen des Firecrawl-Nodes in n8n:

Funktion Was sie macht
Scrape Eine einzelne URL extrahieren (Markdown, Screenshot, Metadaten)
Crawl Gesamte Website rekursiv durchsuchen
Search Web-Suche mit optionalem Scraping der Ergebnisse
Map Alle URLs einer Domain aufdecken
Extract KI-gesteuerte strukturierte Datenextraktion
Batch Scrape Mehrere URLs parallel verarbeiten
Agent Autonome KI-gefuehrte Extraktion

Einrichtung in n8n

n8n Cloud (empfohlen)

  1. Nodes Panel oeffnen
  2. "Firecrawl" suchen und installieren
  3. Auf "Connect" klicken — n8n erstellt automatisch einen Firecrawl-Account mit 100.000 kostenlosen Credits
  4. Kein separater API-Key noetig

Self-Hosted n8n

# Community Node installieren
npm install n8n-nodes-firecrawl

Dann im Node: "Neue Zugangsdaten erstellen" → API-Key aus dem Firecrawl-Dashboard einfuegen.

Beispiel-Workflow: Konkurrenz-Monitoring

Ein typischer Use Case: Taeglich Preise und Inhalte von Wettbewerber-Seiten extrahieren und per E-Mail oder Telegram melden.

[Cron: taeglich 8:00][Firecrawl: Scrape wettbewerber.de/preise][Code: Preis extrahieren][If: Preis veraendert?][Telegram: Nachricht senden]

Nodes in Reihenfolge:

  1. Schedule Trigger — taeglich ausfuehren
  2. Firecrawl (Scrape) — URL und gewuenschtes Format (Markdown) angeben
  3. Code-Node — relevante Daten aus dem Markdown parsen
  4. IF-Node — Vergleich mit gespeicherten Werten
  5. Telegram/E-Mail-Node — Benachrichtigung senden

Beispiel-Workflow: RAG-Wissensbasis aufbauen

Firecrawl kann gesamte Dokumentationen crawlen und als Vektoren in eine Datenbank laden:

[Manuell ausloesen][Firecrawl: Crawl docs.beispiel.de][Embeddings erstellen (OpenAI)][Pinecone / Supabase: Vektoren speichern]

Dieses Pattern wird von n8n selbst fuer die eigene Dokumentations-KI verwendet.

Praxistipps

Kosten kontrollieren:

  • Scrape (1 Seite) = 1 Credit
  • Crawl = 1 Credit pro Seite
  • 100.000 Credits reichen fuer die meisten Hobbyisten
  • Fuer produktive Workloads: Starter-Plan ab $16/Monat

Qualitaet verbessern:

  • onlyMainContent: true entfernt Navigation und Footer automatisch
  • formats: ["markdown"] gibt sauberen Text zurueck
  • Fuer strukturierte Daten formats: ["extract"] mit JSON-Schema verwenden

Als KI-Agent-Tool: Der Firecrawl-Node kann als Tool fuer den n8n AI-Agent-Node eingesetzt werden. Der Agent entscheidet dann autonom wann er scrapt — ideal fuer Research-Agenten.

Offizielle Templates zum Starten

n8n bietet fertige Workflow-Templates:

  • RAG-Ingestion in Pinecone — Docs crawlen, chunken, vektorisieren
  • Lead-Anreicherung — Firmen-URLs scrapen, Kontaktdaten extrahieren
  • Daily Website Monitoring — Aenderungen erkennen, Telegram-Alert senden

Alle Templates findest du unter n8n.io/workflows.

Quellen

Firecrawl + n8n Offizielle Dokumentation

web

Link ↗

Firecrawl + n8n: Real-Time Web Data — n8n Blog

web

Link ↗

Firecrawl Integrations — n8n

web

Link ↗

Hier darfst du aufhören.

Wenn du die Kernidee verstanden hast und einen nächsten Schritt für dich benennen kannst, ist der Beitrag für heute erfüllt. Du musst hier nicht alles in einem Zug durcharbeiten.

War dieser Inhalt hilfreich?