f5xc-firecrawl

f5xc-firecrawl プラグインは、オープンソースの firecrawl エンジンを使用したローカルセルフホスト型 Web スクレイピングを提供します。API キー不要、サブスクリプション不要、クラウド依存なし。すべての操作は、開発コンテナ内の localhost:3002 上のローカル firecrawl インスタンスに対して実行されます。

v1.1.0 Productivity

インストール

/plugin install f5xc-firecrawl@f5-sales-demo-marketplace

コマンド

/scrape

単一の URL をスクレイピングし、コンテンツを Markdown として抽出します。

/scrape https://docs.example.com/getting-started
/scrape https://example.com --format markdown,links --wait 2000

/batch-scrape

複数の URL を一度にスクレイピングします。

/batch-scrape https://example.com https://example.org https://example.net

/crawl

開始 URL から複数のページをクローリングします。

/crawl https://docs.example.com --limit 20 --depth 2
/crawl https://docs.example.com --include /api/* --exclude /blog/*

/map

Web サイト上のすべての URL を探索します。

/map https://docs.example.com
/map https://docs.example.com --search api --subdomains

/search

Web を検索し、オプションで結果をスクレイピングします。

/search "firecrawl web scraping" --limit 10
/search "AI tools 2026" --scrape --time month

/extract

Web ページから LLM を活用した構造化データ抽出を行います。

/extract https://example.com "Extract the main heading and any links"
/extract https://example.com/pricing --schema '{"plans": [{"name": "string", "price": "string"}]}'

/llmstxt

サイト用の llms.txt ファイルを生成します。

/llmstxt https://docs.example.com

スキル

web-scraper

URL のスクレイピング、Web サイトのクローリング、サイト URL のマッピング、Web 検索、構造化データの抽出、llms.txt の生成、複数 URL のバッチスクレイピング、または Web ページの Markdown への変換を依頼した際に自動的に有効化されます。即座に firecrawl-operator エージェントに処理を委譲します。

エージェント

firecrawl-operator

ローカルの firecrawl API に対して curl + jq のシーケンスを実行する自律型 Web スクレイピングエージェントです。v1 エンドポイントのすべてをカバーする 11 種類のプロトコルをサポートします。読み取り専用エージェント（書き込み、編集、またはエージェントツールなし）。

プロトコル	エンドポイント	タイプ
HEALTH	`GET /`	同期
SCRAPE	`POST /v1/scrape`	同期
BATCH_SCRAPE	`POST /v1/batch/scrape`	非同期
CRAWL	`POST /v1/crawl`	非同期
CRAWL_CANCEL	`DELETE /v1/crawl/:id`	同期
CRAWL_ACTIVE	`GET /v1/crawl/active`	同期
CRAWL_ERRORS	`GET /v1/crawl/:id/errors`	同期
MAP	`POST /v1/map`	同期
SEARCH	`POST /v1/search`	同期
EXTRACT	`POST /v1/extract`	非同期
LLMSTXT	`POST /v1/llmstxt`	非同期

インフラストラクチャ

このプラグインは、開発コンテナ内で実行されている firecrawl スタックを必要とします。

コンポーネント	ポート	用途
Firecrawl API	3002	スクレイプ / クロール / マップ / 検索 / 抽出エンドポイントすべて
Playwright	3000	JavaScript レンダリングエンジン
Redis	6379	ジョブキューバックエンド
PostgreSQL	socket	クロール / バッチジョブの永続化
LiteLLM プロキシ	OPENAI_BASE_URL	抽出用 LLM バックエンド（オプション）

ENABLE_FIRECRAWL=true（デフォルト）の場合、スタックは自動的に起動します。SessionStart フックにより API が到達可能かどうかを確認し、サービスがダウンしている場合は警告を表示します。

クラウド版 Firecrawl との違い

このプラグインはセルフホスト型オープンソースバージョンを使用します。

スクレイピングに認証や API キーは不要
クレジット制限やレート制限なし
v1 API エンドポイントを使用（v2 ではない）
ブラウザセッションおよびディープリサーチは利用不可
抽出にはホスト型モデルの代わりに独自の LLM プロキシを使用
ローカルコンテナネットワーク内で完全に動作