Zum Inhalt springen

f5xc-firecrawl

Das f5xc-firecrawl-Plugin bietet lokales selbst gehostetes Web-Scraping über die Open-Source-Engine firecrawl. Keine API-Schlüssel, keine Abonnements, keine Cloud-Abhängigkeit. Alle Operationen werden gegen die lokale Firecrawl-Instanz auf localhost:3002 innerhalb des Entwicklungscontainers ausgeführt.

v1.1.0 Productivity
/plugin install f5xc-firecrawl@f5-sales-demo-marketplace

Eine einzelne URL scrapen und den Inhalt als Markdown extrahieren.

/scrape https://docs.example.com/getting-started
/scrape https://example.com --format markdown,links --wait 2000

Mehrere URLs gleichzeitig scrapen.

/batch-scrape https://example.com https://example.org https://example.net

Mehrere Seiten von einer Start-URL aus crawlen.

/crawl https://docs.example.com --limit 20 --depth 2
/crawl https://docs.example.com --include /api/* --exclude /blog/*

Alle URLs einer Website entdecken.

/map https://docs.example.com
/map https://docs.example.com --search api --subdomains

Das Web durchsuchen und optional Ergebnisse scrapen.

/search "firecrawl web scraping" --limit 10
/search "AI tools 2026" --scrape --time month

KI-gestützte strukturierte Datenextraktion aus Webseiten.

/extract https://example.com "Extract the main heading and any links"
/extract https://example.com/pricing --schema '{"plans": [{"name": "string", "price": "string"}]}'

Eine llms.txt-Datei für eine Website generieren.

/llmstxt https://docs.example.com

Wird automatisch aktiviert, wenn Sie darum bitten, eine URL zu scrapen, eine Website zu crawlen, Site-URLs zu mappen, das Web zu durchsuchen, strukturierte Daten zu extrahieren, eine llms.txt zu generieren, mehrere URLs als Batch zu scrapen oder eine Webseite in Markdown zu konvertieren. Delegiert sofort an den firecrawl-operator-Agenten.

Autonomer Web-Scraping-Agent, der curl- und jq-Sequenzen gegen die lokale Firecrawl-API ausführt. Unterstützt 11 Protokolle, die alle v1-Endpunkte abdecken. Nur-Lese-Agent (keine Schreib-, Bearbeitungs- oder Agenten-Werkzeuge).

ProtokollEndpunktTyp
HEALTHGET /Sync
SCRAPEPOST /v1/scrapeSync
BATCH_SCRAPEPOST /v1/batch/scrapeAsync
CRAWLPOST /v1/crawlAsync
CRAWL_CANCELDELETE /v1/crawl/:idSync
CRAWL_ACTIVEGET /v1/crawl/activeSync
CRAWL_ERRORSGET /v1/crawl/:id/errorsSync
MAPPOST /v1/mapSync
SEARCHPOST /v1/searchSync
EXTRACTPOST /v1/extractAsync
LLMSTXTPOST /v1/llmstxtAsync

Das Plugin erfordert den Firecrawl-Stack, der im Entwicklungscontainer läuft:

KomponentePortZweck
Firecrawl API3002Alle Scrape/Crawl/Map/Search/Extract-Endpunkte
Playwright3000JavaScript-Rendering-Engine
Redis6379Job-Queue-Backend
PostgreSQLsocketPersistenz für Crawl-/Batch-Jobs
LiteLLM-ProxyOPENAI_BASE_URLKI-Backend für Extract (optional)

Der Stack startet automatisch, wenn ENABLE_FIRECRAWL=true gesetzt ist (der Standardwert). Ein SessionStart-Hook prüft, ob die API erreichbar ist, und gibt eine Warnung aus, wenn der Dienst nicht verfügbar ist.

Dieses Plugin verwendet die selbst gehostete Open-Source-Version:

  • Keine Authentifizierung oder API-Schlüssel für das Scraping erforderlich
  • Keine Kreditlimits oder Ratenbegrenzung
  • Verwendet v1-API-Endpunkte (nicht v2)
  • Browser-Sitzungen und Deep Research nicht verfügbar
  • Extract verwendet Ihren eigenen KI-Proxy anstelle von gehosteten Modellen
  • Läuft vollständig innerhalb des lokalen Container-Netzwerks