f5xc-firecrawl

O plugin f5xc-firecrawl fornece web scraping local auto-hospedado via o motor open-source firecrawl. Sem chaves de API, sem assinaturas, sem dependência de nuvem. Todas as operações são executadas na instância local do firecrawl em localhost:3002 dentro do devcontainer.

v1.1.0 Productivity

Instalação

/plugin install f5xc-firecrawl@f5-sales-demo-marketplace

Comandos

/scrape

Realiza o scraping de uma única URL e extrai o conteúdo como markdown.

/scrape https://docs.example.com/getting-started
/scrape https://example.com --format markdown,links --wait 2000

/batch-scrape

Realiza o scraping de múltiplas URLs ao mesmo tempo.

/batch-scrape https://example.com https://example.org https://example.net

/crawl

Rastreia múltiplas páginas a partir de uma URL inicial.

/crawl https://docs.example.com --limit 20 --depth 2
/crawl https://docs.example.com --include /api/* --exclude /blog/*

/map

Descobre todas as URLs de um site.

/map https://docs.example.com
/map https://docs.example.com --search api --subdomains

/search

Pesquisa na web e, opcionalmente, realiza o scraping dos resultados.

/search "firecrawl web scraping" --limit 10
/search "AI tools 2026" --scrape --time month

/extract

Extração de dados estruturados com base em LLM a partir de páginas web.

/extract https://example.com "Extract the main heading and any links"
/extract https://example.com/pricing --schema '{"plans": [{"name": "string", "price": "string"}]}'

/llmstxt

Gera um arquivo llms.txt para um site.

/llmstxt https://docs.example.com

Skills

web-scraper

Ativa-se automaticamente quando você solicita o scraping de uma URL, rastreamento de um site, mapeamento de URLs do site, pesquisa na web, extração de dados estruturados, geração de llms.txt, scraping em lote de múltiplas URLs ou conversão de uma página web para markdown. Delega imediatamente para o agente firecrawl-operator.

Agentes

firecrawl-operator

Agente autônomo de web scraping que executa sequências de curl + jq contra a API local do firecrawl. Suporta 11 protocolos cobrindo todos os endpoints v1. Agente somente leitura (sem ferramentas de escrita, edição ou agente).

Protocolo	Endpoint	Tipo
HEALTH	`GET /`	Síncrono
SCRAPE	`POST /v1/scrape`	Síncrono
BATCH_SCRAPE	`POST /v1/batch/scrape`	Assíncrono
CRAWL	`POST /v1/crawl`	Assíncrono
CRAWL_CANCEL	`DELETE /v1/crawl/:id`	Síncrono
CRAWL_ACTIVE	`GET /v1/crawl/active`	Síncrono
CRAWL_ERRORS	`GET /v1/crawl/:id/errors`	Síncrono
MAP	`POST /v1/map`	Síncrono
SEARCH	`POST /v1/search`	Síncrono
EXTRACT	`POST /v1/extract`	Assíncrono
LLMSTXT	`POST /v1/llmstxt`	Assíncrono

Infraestrutura

O plugin requer a stack do firecrawl em execução no devcontainer:

Componente	Porta	Finalidade
Firecrawl API	3002	Todos os endpoints de scrape/crawl/map/search/extract
Playwright	3000	Motor de renderização JavaScript
Redis	6379	Backend da fila de jobs
PostgreSQL	socket	Persistência de jobs de crawl/batch
Proxy LiteLLM	OPENAI_BASE_URL	Backend LLM para extract (opcional)

A stack inicia automaticamente quando ENABLE_FIRECRAWL=true (o padrão). Um hook SessionStart verifica se a API está acessível e emite um aviso caso o serviço esteja indisponível.

Diferenças em relação ao Firecrawl na Nuvem

Este plugin utiliza a versão open-source auto-hospedada:

Nenhuma autenticação ou chave de API necessária para scraping
Sem limites de crédito ou limitação de taxa
Utiliza endpoints da API v1 (não v2)
Sessões de navegador e pesquisa aprofundada não estão disponíveis
O extract utiliza seu próprio proxy LLM em vez de modelos hospedados
Executa inteiramente dentro da rede local do container