f5xc-firecrawl

Das f5xc-firecrawl-Plugin bietet lokales selbst gehostetes Web-Scraping über die Open-Source-Engine firecrawl. Keine API-Schlüssel, keine Abonnements, keine Cloud-Abhängigkeit. Alle Operationen werden gegen die lokale Firecrawl-Instanz auf localhost:3002 innerhalb des Entwicklungscontainers ausgeführt.

v1.1.0 Productivity

Installation

/plugin install f5xc-firecrawl@f5-sales-demo-marketplace

Befehle

/scrape

Eine einzelne URL scrapen und den Inhalt als Markdown extrahieren.

/scrape https://docs.example.com/getting-started
/scrape https://example.com --format markdown,links --wait 2000

/batch-scrape

Mehrere URLs gleichzeitig scrapen.

/batch-scrape https://example.com https://example.org https://example.net

/crawl

Mehrere Seiten von einer Start-URL aus crawlen.

/crawl https://docs.example.com --limit 20 --depth 2
/crawl https://docs.example.com --include /api/* --exclude /blog/*

/map

Alle URLs einer Website entdecken.

/map https://docs.example.com
/map https://docs.example.com --search api --subdomains

/search

Das Web durchsuchen und optional Ergebnisse scrapen.

/search "firecrawl web scraping" --limit 10
/search "AI tools 2026" --scrape --time month

/extract

KI-gestützte strukturierte Datenextraktion aus Webseiten.

/extract https://example.com "Extract the main heading and any links"
/extract https://example.com/pricing --schema '{"plans": [{"name": "string", "price": "string"}]}'

/llmstxt

Eine llms.txt-Datei für eine Website generieren.

/llmstxt https://docs.example.com

Fähigkeiten

web-scraper

Wird automatisch aktiviert, wenn Sie darum bitten, eine URL zu scrapen, eine Website zu crawlen, Site-URLs zu mappen, das Web zu durchsuchen, strukturierte Daten zu extrahieren, eine llms.txt zu generieren, mehrere URLs als Batch zu scrapen oder eine Webseite in Markdown zu konvertieren. Delegiert sofort an den firecrawl-operator-Agenten.

Agenten

firecrawl-operator

Autonomer Web-Scraping-Agent, der curl- und jq-Sequenzen gegen die lokale Firecrawl-API ausführt. Unterstützt 11 Protokolle, die alle v1-Endpunkte abdecken. Nur-Lese-Agent (keine Schreib-, Bearbeitungs- oder Agenten-Werkzeuge).

Protokoll	Endpunkt	Typ
HEALTH	`GET /`	Sync
SCRAPE	`POST /v1/scrape`	Sync
BATCH_SCRAPE	`POST /v1/batch/scrape`	Async
CRAWL	`POST /v1/crawl`	Async
CRAWL_CANCEL	`DELETE /v1/crawl/:id`	Sync
CRAWL_ACTIVE	`GET /v1/crawl/active`	Sync
CRAWL_ERRORS	`GET /v1/crawl/:id/errors`	Sync
MAP	`POST /v1/map`	Sync
SEARCH	`POST /v1/search`	Sync
EXTRACT	`POST /v1/extract`	Async
LLMSTXT	`POST /v1/llmstxt`	Async

Infrastruktur

Das Plugin erfordert den Firecrawl-Stack, der im Entwicklungscontainer läuft:

Komponente	Port	Zweck
Firecrawl API	3002	Alle Scrape/Crawl/Map/Search/Extract-Endpunkte
Playwright	3000	JavaScript-Rendering-Engine
Redis	6379	Job-Queue-Backend
PostgreSQL	socket	Persistenz für Crawl-/Batch-Jobs
LiteLLM-Proxy	OPENAI_BASE_URL	KI-Backend für Extract (optional)

Der Stack startet automatisch, wenn ENABLE_FIRECRAWL=true gesetzt ist (der Standardwert). Ein SessionStart-Hook prüft, ob die API erreichbar ist, und gibt eine Warnung aus, wenn der Dienst nicht verfügbar ist.

Unterschiede zur Cloud-Version von Firecrawl

Dieses Plugin verwendet die selbst gehostete Open-Source-Version:

Keine Authentifizierung oder API-Schlüssel für das Scraping erforderlich
Keine Kreditlimits oder Ratenbegrenzung
Verwendet v1-API-Endpunkte (nicht v2)
Browser-Sitzungen und Deep Research nicht verfügbar
Extract verwendet Ihren eigenen KI-Proxy anstelle von gehosteten Modellen
Läuft vollständig innerhalb des lokalen Container-Netzwerks