تخطَّ إلى المحتوى

f5xc-firecrawl

يوفر مكوّن f5xc-firecrawl خدمة كشط الويب محلياً باستخدام محرك firecrawl مفتوح المصدر. لا مفاتيح API، ولا اشتراكات، ولا اعتماد على السحابة. تعمل جميع العمليات على نسخة firecrawl المحلية على localhost:3002 داخل حاوية التطوير.

v1.1.0 Productivity
/plugin install f5xc-firecrawl@f5-sales-demo-marketplace

كشط رابط URL واحد واستخراج محتواه بصيغة markdown.

/scrape https://docs.example.com/getting-started
/scrape https://example.com --format markdown,links --wait 2000

كشط روابط URL متعددة في آنٍ واحد.

/batch-scrape https://example.com https://example.org https://example.net

استكشاف صفحات متعددة انطلاقاً من رابط URL ابتدائي.

/crawl https://docs.example.com --limit 20 --depth 2
/crawl https://docs.example.com --include /api/* --exclude /blog/*

اكتشاف جميع روابط URL على موقع ويب.

/map https://docs.example.com
/map https://docs.example.com --search api --subdomains

البحث في الويب واختياري كشط النتائج.

/search "firecrawl web scraping" --limit 10
/search "AI tools 2026" --scrape --time month

استخراج بيانات منظَّمة من صفحات الويب بتقنية نماذج اللغة الكبيرة (LLM).

/extract https://example.com "Extract the main heading and any links"
/extract https://example.com/pricing --schema '{"plans": [{"name": "string", "price": "string"}]}'

توليد ملف llms.txt لموقع ما.

/llmstxt https://docs.example.com

يُفعَّل تلقائياً عند طلب كشط رابط URL، أو استكشاف موقع ويب، أو رسم خريطة لروابط الموقع، أو البحث في الويب، أو استخراج بيانات منظَّمة، أو توليد ملف llms.txt، أو الكشط الجماعي لروابط متعددة، أو تحويل صفحة ويب إلى markdown. يُفوِّض التنفيذ فوراً إلى وكيل firecrawl-operator.

وكيل كشط ويب ذاتي يُنفِّذ تسلسلات curl + jq على واجهة firecrawl API المحلية. يدعم 11 بروتوكولاً تغطي جميع نقاط نهاية v1. وكيل للقراءة فقط (لا أدوات Write أو Edit أو Agent).

البروتوكولنقطة النهايةالنوع
HEALTHGET /متزامن
SCRAPEPOST /v1/scrapeمتزامن
BATCH_SCRAPEPOST /v1/batch/scrapeغير متزامن
CRAWLPOST /v1/crawlغير متزامن
CRAWL_CANCELDELETE /v1/crawl/:idمتزامن
CRAWL_ACTIVEGET /v1/crawl/activeمتزامن
CRAWL_ERRORSGET /v1/crawl/:id/errorsمتزامن
MAPPOST /v1/mapمتزامن
SEARCHPOST /v1/searchمتزامن
EXTRACTPOST /v1/extractغير متزامن
LLMSTXTPOST /v1/llmstxtغير متزامن

يتطلب المكوّن تشغيل حزمة firecrawl داخل حاوية التطوير:

المكوّنالمنفذالغرض
Firecrawl API3002جميع نقاط نهاية الكشط/الاستكشاف/الخريطة/البحث/الاستخراج
Playwright3000محرك عرض JavaScript
Redis6379خلفية قائمة انتظار المهام
PostgreSQLsocketاستمرارية مهام الاستكشاف والكشط الجماعي
LiteLLM proxyOPENAI_BASE_URLخلفية LLM للاستخراج (اختياري)

تبدأ الحزمة تلقائياً عند تفعيل ENABLE_FIRECRAWL=true (الإعداد الافتراضي). تتحقق خطافة SessionStart من إمكانية الوصول إلى واجهة API وتُصدر تحذيراً إذا كانت الخدمة متوقفة.

الفوارق عن Firecrawl السحابي

Section titled “الفوارق عن Firecrawl السحابي”

يستخدم هذا المكوّن النسخة المستضافة ذاتياً مفتوحة المصدر:

  • لا مصادقة أو مفاتيح API مطلوبة للكشط
  • لا حدود ائتمانية أو تقييد لمعدل الطلبات
  • يستخدم نقاط نهاية واجهة v1 API (وليس v2)
  • جلسات المتصفح والبحث المعمّق غير متاحَين
  • يستخدم الاستخراج وكيل LLM الخاص بك عوضاً عن النماذج المستضافة
  • يعمل بالكامل داخل شبكة الحاوية المحلية