f5xc-firecrawl
f5xc-firecrawl プラグインは、オープンソースの firecrawl エンジンを使用したローカルセルフホスト型 Web スクレイピングを提供します。API キー不要、サブスクリプション不要、クラウド依存なし。すべての操作は、開発コンテナ内の localhost:3002 上のローカル firecrawl インスタンスに対して実行されます。
インストール
Section titled “インストール”/plugin install f5xc-firecrawl@f5-sales-demo-marketplace/scrape
Section titled “/scrape”単一の URL をスクレイピングし、コンテンツを Markdown として抽出します。
/scrape https://docs.example.com/getting-started/scrape https://example.com --format markdown,links --wait 2000/batch-scrape
Section titled “/batch-scrape”複数の URL を一度にスクレイピングします。
/batch-scrape https://example.com https://example.org https://example.net/crawl
Section titled “/crawl”開始 URL から複数のページをクローリングします。
/crawl https://docs.example.com --limit 20 --depth 2/crawl https://docs.example.com --include /api/* --exclude /blog/*Web サイト上のすべての URL を探索します。
/map https://docs.example.com/map https://docs.example.com --search api --subdomains/search
Section titled “/search”Web を検索し、オプションで結果をスクレイピングします。
/search "firecrawl web scraping" --limit 10/search "AI tools 2026" --scrape --time month/extract
Section titled “/extract”Web ページから LLM を活用した構造化データ抽出を行います。
/extract https://example.com "Extract the main heading and any links"/extract https://example.com/pricing --schema '{"plans": [{"name": "string", "price": "string"}]}'/llmstxt
Section titled “/llmstxt”サイト用の llms.txt ファイルを生成します。
/llmstxt https://docs.example.comweb-scraper
Section titled “web-scraper”URL のスクレイピング、Web サイトのクローリング、サイト URL のマッピング、Web 検索、構造化データの抽出、llms.txt の生成、複数 URL のバッチスクレイピング、または Web ページの Markdown への変換を依頼した際に自動的に有効化されます。即座に firecrawl-operator エージェントに処理を委譲します。
エージェント
Section titled “エージェント”firecrawl-operator
Section titled “firecrawl-operator”ローカルの firecrawl API に対して curl + jq のシーケンスを実行する自律型 Web スクレイピングエージェントです。v1 エンドポイントのすべてをカバーする 11 種類のプロトコルをサポートします。読み取り専用エージェント(書き込み、編集、またはエージェントツールなし)。
| プロトコル | エンドポイント | タイプ |
|---|---|---|
| HEALTH | GET / | 同期 |
| SCRAPE | POST /v1/scrape | 同期 |
| BATCH_SCRAPE | POST /v1/batch/scrape | 非同期 |
| CRAWL | POST /v1/crawl | 非同期 |
| CRAWL_CANCEL | DELETE /v1/crawl/:id | 同期 |
| CRAWL_ACTIVE | GET /v1/crawl/active | 同期 |
| CRAWL_ERRORS | GET /v1/crawl/:id/errors | 同期 |
| MAP | POST /v1/map | 同期 |
| SEARCH | POST /v1/search | 同期 |
| EXTRACT | POST /v1/extract | 非同期 |
| LLMSTXT | POST /v1/llmstxt | 非同期 |
インフラストラクチャ
Section titled “インフラストラクチャ”このプラグインは、開発コンテナ内で実行されている firecrawl スタックを必要とします。
| コンポーネント | ポート | 用途 |
|---|---|---|
| Firecrawl API | 3002 | スクレイプ / クロール / マップ / 検索 / 抽出エンドポイントすべて |
| Playwright | 3000 | JavaScript レンダリングエンジン |
| Redis | 6379 | ジョブキューバックエンド |
| PostgreSQL | socket | クロール / バッチジョブの永続化 |
| LiteLLM プロキシ | OPENAI_BASE_URL | 抽出用 LLM バックエンド(オプション) |
ENABLE_FIRECRAWL=true(デフォルト)の場合、スタックは自動的に起動します。SessionStart フックにより API が到達可能かどうかを確認し、サービスがダウンしている場合は警告を表示します。
クラウド版 Firecrawl との違い
Section titled “クラウド版 Firecrawl との違い”このプラグインはセルフホスト型オープンソースバージョンを使用します。
- スクレイピングに認証や API キーは不要
- クレジット制限やレート制限なし
- v1 API エンドポイントを使用(v2 ではない)
- ブラウザセッションおよびディープリサーチは利用不可
- 抽出にはホスト型モデルの代わりに独自の LLM プロキシを使用
- ローカルコンテナネットワーク内で完全に動作