コンテンツにスキップ

f5xc-firecrawl

f5xc-firecrawl プラグインは、オープンソースの firecrawl エンジンを使用したローカルセルフホスト型 Web スクレイピングを提供します。API キー不要、サブスクリプション不要、クラウド依存なし。すべての操作は、開発コンテナ内の localhost:3002 上のローカル firecrawl インスタンスに対して実行されます。

v1.1.0 Productivity
/plugin install f5xc-firecrawl@f5-sales-demo-marketplace

単一の URL をスクレイピングし、コンテンツを Markdown として抽出します。

/scrape https://docs.example.com/getting-started
/scrape https://example.com --format markdown,links --wait 2000

複数の URL を一度にスクレイピングします。

/batch-scrape https://example.com https://example.org https://example.net

開始 URL から複数のページをクローリングします。

/crawl https://docs.example.com --limit 20 --depth 2
/crawl https://docs.example.com --include /api/* --exclude /blog/*

Web サイト上のすべての URL を探索します。

/map https://docs.example.com
/map https://docs.example.com --search api --subdomains

Web を検索し、オプションで結果をスクレイピングします。

/search "firecrawl web scraping" --limit 10
/search "AI tools 2026" --scrape --time month

Web ページから LLM を活用した構造化データ抽出を行います。

/extract https://example.com "Extract the main heading and any links"
/extract https://example.com/pricing --schema '{"plans": [{"name": "string", "price": "string"}]}'

サイト用の llms.txt ファイルを生成します。

/llmstxt https://docs.example.com

URL のスクレイピング、Web サイトのクローリング、サイト URL のマッピング、Web 検索、構造化データの抽出、llms.txt の生成、複数 URL のバッチスクレイピング、または Web ページの Markdown への変換を依頼した際に自動的に有効化されます。即座に firecrawl-operator エージェントに処理を委譲します。

ローカルの firecrawl API に対して curl + jq のシーケンスを実行する自律型 Web スクレイピングエージェントです。v1 エンドポイントのすべてをカバーする 11 種類のプロトコルをサポートします。読み取り専用エージェント(書き込み、編集、またはエージェントツールなし)。

プロトコルエンドポイントタイプ
HEALTHGET /同期
SCRAPEPOST /v1/scrape同期
BATCH_SCRAPEPOST /v1/batch/scrape非同期
CRAWLPOST /v1/crawl非同期
CRAWL_CANCELDELETE /v1/crawl/:id同期
CRAWL_ACTIVEGET /v1/crawl/active同期
CRAWL_ERRORSGET /v1/crawl/:id/errors同期
MAPPOST /v1/map同期
SEARCHPOST /v1/search同期
EXTRACTPOST /v1/extract非同期
LLMSTXTPOST /v1/llmstxt非同期

このプラグインは、開発コンテナ内で実行されている firecrawl スタックを必要とします。

コンポーネントポート用途
Firecrawl API3002スクレイプ / クロール / マップ / 検索 / 抽出エンドポイントすべて
Playwright3000JavaScript レンダリングエンジン
Redis6379ジョブキューバックエンド
PostgreSQLsocketクロール / バッチジョブの永続化
LiteLLM プロキシOPENAI_BASE_URL抽出用 LLM バックエンド(オプション)

ENABLE_FIRECRAWL=true(デフォルト)の場合、スタックは自動的に起動します。SessionStart フックにより API が到達可能かどうかを確認し、サービスがダウンしている場合は警告を表示します。

このプラグインはセルフホスト型オープンソースバージョンを使用します。

  • スクレイピングに認証や API キーは不要
  • クレジット制限やレート制限なし
  • v1 API エンドポイントを使用(v2 ではない)
  • ブラウザセッションおよびディープリサーチは利用不可
  • 抽出にはホスト型モデルの代わりに独自の LLM プロキシを使用
  • ローカルコンテナネットワーク内で完全に動作