طوال معظم العقد الماضي، كان تشغيل نموذج ذكاء اصطناعي يعني استئجار خادم GPU، وإدارة برامج التشغيل، والدفع مقابل ذلك العتاد سواء وردت الطلبات أم لا. تغيّر Cloudflare Workers AI هذا النموذج بالكامل: تستدعي نموذج ذكاء اصطناعي بالطريقة نفسها التي تستدعي بها أي دالة أخرى في Worker، فيعمل على وحدات GPU موزعة عبر شبكة Cloudflare العالمية، وتدفع فقط مقابل ما تستخدمه. لا خوادم لتجهيزها، ولا وحدات GPU لرعايتها، واستدلال يحدث قريبًا من مستخدميك.

يشرح هذا الدليل ما هو Workers AI، وأي النماذج يمكنك تشغيلها، وكم يكلّف في إطار نموذج تسعير Neurons، وكيف تستدعيه من الكود، بما في ذلك مثال عملي لتوليد الصور. وهو جزء من دليل Cloudflare المستمر الخاص بي لبناء تطبيقات سريعة وحديثة على الحافة.

باختصار

  • Workers AI هو ذكاء اصطناعي بدون خوادم: يشغّل نماذج LLM وتوليد الصور والـ embeddings والنماذج الصوتية على وحدات GPU الحافيّة لدى Cloudflare، ويُستدعى من Worker
  • يستخدم التسعير Neurons: تحصل على 10,000 Neuron يوميًا مجانًا، ثم تدفع 0.011 دولار لكل 1,000 Neuron
  • يغطي أربع عائلات من النماذج: النص (LLM)، والصورة، والـ embeddings، والصوت، مع إضافة نماذج جديدة بانتظام
  • يمكنك توليد الصور على الحافة وتحسينها باستخدام Cloudflare Image Transformations
  • يقترن بشكل طبيعي مع بقية منصة Workers: KV وR2 وD1 وVectorize لتطبيقات ذكاء اصطناعي كاملة
  • بحاجة إلى مساعدة في إطلاق ميزة ذكاء اصطناعي؟ هذا بالضبط ما من أجله خدمة تنفيذ الذكاء الاصطناعي الخاصة بي

ما هو Workers AI حقًا

يتيح لك Cloudflare Workers AI تشغيل نماذج التعلم الآلي على شبكة Cloudflare باستخدام binding بسيط داخل Worker. تستضيف Cloudflare وحدات GPU والنماذج؛ أنت ترسل المدخلات وتستقبل المخرجات. لا توجد بنية تحتية لإدارتها، ولا إقلاع بارد لوحدة GPU تدفع مقابله، ولا حد أدنى للالتزام الشهري.

ولأن الاستدلال يعمل على شبكة Cloudflare الموزعة بدلًا من منطقة واحدة، يُنفَّذ النموذج قريبًا من مستخدمك. وبالنسبة للميزات التفاعلية مثل الدردشة أو التصنيف أو توليد المحتوى، يقلّل هذا القرب من زمن الاستجابة بطريقة لا يستطيع عنقود GPU مركزي مجاراتها.

النماذج مفتوحة وتديرها Cloudflare. تشير إلى نموذج باسمه، مثل أحد متغيرات Llama للنص أو أحد متغيرات Flux للصور، وتُبقي Cloudflare الكتالوج محدّثًا كلما صدرت نماذج مفتوحة أفضل.

نماذج Cloudflare Workers AI التي يمكنك تشغيلها

ينظّم Workers AI كتالوجه في أربع عائلات رئيسية، إضافة إلى مجموعة من النماذج المتخصصة:

  • النص (LLM). نماذج لغوية مثل متغيرات Llama وMistral وQwen للدردشة والتلخيص والاستخراج والتصنيف وتوليد المحتوى. تُحتسب على رموز الإدخال والإخراج.
  • الصورة. نماذج توليد مثل متغيرات Flux التي تنشئ صورًا من مطالبات نصية. تُحتسب حسب الـ tiles والـ steps.
  • الـ Embeddings. نماذج مثل BGE تحوّل النص إلى متجهات للبحث الدلالي والتوليد المعزّز بالاسترجاع. تُحتسب على رموز الإدخال.
  • الصوت. نماذج تحويل الكلام إلى نص وتحويل النص إلى كلام. تُحتسب بالدقيقة أو بالحرف.
  • أخرى. نماذج متخصصة للترجمة وإعادة الترتيب وتصنيف الصور والتعرّف عليها.

يتطور الكتالوج بسرعة، لذا تحقق دائمًا من قائمة النماذج الحالية للحصول على أحدث الخيارات وأسعارها الدقيقة.

أسعار Cloudflare Workers AI: كيف تعمل Neurons

يستخدم Workers AI وحدة موحّدة تُسمّى Neuron للتعبير عن تكلفة الاستدلال عبر كل نوع من النماذج. فبدلًا من التوفيق بين أسعار منفصلة للرموز والـ tiles والـ steps ودقائق الصوت، تحوّل Cloudflare كل ذلك إلى Neurons لتكون لديك قيمة واحدة تستند إليها.

استنادًا إلى أسعار Workers AI الرسمية لعام 2026:

الخطةNeurons
المخصّص المجاني (خطتا Free وPaid)10,000 Neuron يوميًا
الاستخدام المدفوع فوق المخصّص المجاني0.011 دولار لكل 1,000 Neuron

يُعاد ضبط المخصّص المجاني اليومي عند الساعة 00:00 بتوقيت UTC. وبالنسبة للنماذج الأولية والمشاريع الجانبية والميزات منخفضة الحركة، غالبًا ما تعني 10,000 Neuron يوميًا أن ميزتك المعتمِدة على الذكاء الاصطناعي تعمل دون أي تكلفة على الإطلاق. وعندما تتجاوزها، يكون السعر منخفضًا بما يكفي بحيث لا يكلّف قدر كبير من الاستدلال سوى بضعة دولارات.

ولأن النماذج المختلفة تستهلك Neurons بمعدلات مختلفة، تعتمد التكلفة العملية على أي نموذج تستدعيه وكم من البيانات ترسل. تسرد صفحة الأسعار تكلفة Neuron لكل نموذج، فيمكنك التقدير قبل أن تبني.

استدعاء نموذج نصي من Worker

إليك النمط الأساسي. تربط Workers AI في wrangler.toml، ثم تستدعي env.AI.run() باسم نموذج ومدخل:

 1export default {
 2  async fetch(request, env) {
 3    const response = await env.AI.run("@cf/meta/llama-3.1-8b-instruct", {
 4      messages: [
 5        { role: "system", content: "You are a concise assistant." },
 6        { role: "user", content: "Summarise the benefits of edge computing in one sentence." },
 7      ],
 8    });
 9
10    return Response.json(response);
11  },
12};

يُضبط الـ binding المسمّى AI مرة واحدة في إعدادات Worker الخاص بك. بعد ذلك، يكون استدعاء نموذج عبارة عن استدعاء دالة غير متزامن واحد، يعيد مخرجات النموذج لتستخدمها كما يحلو لك.

توليد الصور على الحافة

يُعد توليد الصور من أكثر حالات استخدام Workers AI إقناعًا، وهو يرتبط مباشرة باستضافة الصور وتسليمها، وهو موضوع متكرر في هذه المدونة. يمكنك توليد صورة من مطالبة نصية وبثّ البايتات مباشرة في الاستجابة:

 1export default {
 2  async fetch(request, env) {
 3    const inputs = { prompt: "a minimalist mountain landscape at sunrise, flat illustration" };
 4
 5    const image = await env.AI.run(
 6      "@cf/black-forest-labs/flux-1-schnell",
 7      inputs
 8    );
 9
10    return new Response(image, {
11      headers: { "content-type": "image/png" },
12    });
13  },
14};

من الأنماط القوية أن تولّد الصورة، وتخزّنها في Cloudflare R2 ، ثم تسلّمها محسّنة عبر image transformations . يمنحك ذلك أعمالًا فنية مولّدة بالذكاء الاصطناعي، مخزّنة بدون رسوم خروج، ومُسلَّمة بصيغة WebP أو AVIF بحجم مثالي. خط المعالجة بأكمله، من التوليد والتخزين والتسليم، يعيش داخل Cloudflare.

بناء تطبيقات ذكاء اصطناعي كاملة

يكون Workers AI أقوى ما يكون عند دمجه مع بقية المنصة. يجمع تطبيق ذكاء اصطناعي واقعي عدة قطع معًا:

  • Workers AI للاستدلال (LLM، الـ embeddings، توليد الصور)
  • Vectorize كقاعدة بيانات متجهات للبحث الدلالي والتوليد المعزّز بالاسترجاع
  • R2 لتخزين المستندات أو الصور أو الصوت
  • D1 لبيانات التطبيق المنظَّمة (اقرأ دليل D1 الخاص بي )
  • KV للتخزين المؤقت والإعدادات

على سبيل المثال، سيُضمّن روبوت محادثة للتوثيق محتواك بنموذج embeddings، ويخزّن المتجهات في Vectorize، ويسترجع المقاطع ذات الصلة وقت الاستعلام، ويغذّيها إلى LLM، كل ذلك داخل Worker واحد، وكله على الحافة. هذه هي البنية وراء معظم ميزات الذكاء الاصطناعي الحديثة المعزّزة بالاسترجاع. يمكنك إدارة طبقات التخزين خلف هذه التطبيقات من سطح مكتبك باستخدام تطبيقاتي المجانية Easy Cloudflare R2 وEasy Cloudflare D1 وEasy Cloudflare KV ، المتاحة لأنظمة Windows وmacOS وLinux.

متى يكون Workers AI الخيار الصحيح

يُعد Workers AI ملائمًا ممتازًا عندما:

  • تريد استدلال ذكاء اصطناعي دون إدارة بنية تحتية لوحدات GPU
  • يهمّك زمن الاستجابة المنخفض ويكون مستخدموك عالميين
  • يكون عبء العمل لديك متقطعًا أو غير متوقع، بحيث يتفوّق الدفع حسب الاستخدام على العتاد المحجوز
  • تبني بالفعل على Workers وتريد كل شيء على منصة واحدة
  • تلبّي النماذج المفتوحة في الكتالوج احتياجات الجودة لديك

وهو أقل ملاءمة للحالات التي تتطلب نموذجًا احتكاريًا متقدمًا محددًا غير موجود في الكتالوج، أو للاستدلال الدفعي الثقيل جدًا حيث قد يكون العتاد المخصص أرخص عند الاستخدام الكامل المستمر. ولهذه الحالات، يشيع نهج هجين، يستدعي مزوّد نماذج خارجيًا من Worker الخاص بك، وهو أمر أساعد العملاء على تصميمه عبر خدمات تكامل الذكاء الاصطناعي الخاصة بي.

أهم النقاط

  • يشغّل Workers AI نماذج LLM والصور والـ embeddings والصوت على وحدات GPU الحافيّة لدى Cloudflare دون بنية تحتية لإدارتها
  • التسعير موحّد بـ Neurons: 10,000 مجانًا يوميًا، ثم 0.011 دولار لكل 1,000 Neuron
  • استدعاء نموذج هو استدعاء env.AI.run() واحد داخل Worker
  • يمكنك توليد الصور على الحافة، وتخزينها في R2، وتسليمها محسّنة عبر التحويلات
  • يتكامل مع Vectorize وR2 وD1 وKV لبناء تطبيقات ذكاء اصطناعي كاملة على منصة واحدة
  • يجعله الدفع حسب الاستخدام وزمن الاستجابة المنخفض عالميًا مثاليًا للميزات المتقطعة الموجهة للمستخدم

الأسئلة الشائعة

ما هو Cloudflare Workers AI؟ هو خدمة تشغّل نماذج التعلم الآلي على شبكة Cloudflare من وحدات GPU الحافيّة. تستدعي نموذجًا من Worker باستخدام الـ binding المسمّى AI، وتتولى Cloudflare العتاد واستضافة النماذج. لا توجد خوادم أو وحدات GPU عليك إدارتها.

ما هو الـ Neuron في تسعير Workers AI؟ الـ Neuron هو وحدة Cloudflare الموحّدة لقياس تكلفة الاستدلال عبر جميع أنواع النماذج. تُحوَّل الرموز وtiles الصور وsteps التوليد ودقائق الصوت جميعها إلى Neurons لتكون لديك قيمة واحدة تتابعها. تحصل على 10,000 مجانًا يوميًا، ثم تدفع 0.011 دولار لكل 1,000.

هل يستطيع Workers AI توليد الصور؟ نعم. يتضمن الكتالوج نماذج تحويل النص إلى صورة مثل متغيرات Flux. تستدعي النموذج بمطالبة وتستقبل بايتات الصورة، التي يمكنك إعادتها مباشرة، أو تخزينها في R2، أو تحسينها بـ image transformations.

هل Workers AI مجاني؟ يوجد مخصّص مجاني قدره 10,000 Neuron يوميًا على خطتي Workers من النوع Free وPaid، يُعاد ضبطه يوميًا عند الساعة 00:00 بتوقيت UTC. تعمل كثير من الميزات الصغيرة بالكامل ضمن هذا المخصّص. وفوق ذلك، يُحتسب الاستخدام بسعر 0.011 دولار لكل 1,000 Neuron.

أي النماذج يدعمها Workers AI؟ يدعم أربع عائلات: نماذج LLM النصية (Llama وMistral وQwen)، وتوليد الصور (Flux)، والـ embeddings (BGE)، والصوت (تحويل الكلام إلى نص وتحويل النص إلى كلام)، إضافة إلى نماذج متخصصة للترجمة وإعادة الترتيب والتصنيف. يُحدَّث الكتالوج بانتظام.

كيف يُقارن Workers AI بتشغيل خادم GPU خاص بي؟ يزيل Workers AI تجهيز وحدات GPU، والتوسّع، وإدارة تكلفة الخمول، ويشغّل الاستدلال قريبًا من المستخدمين عالميًا. قد يكون خادم GPU مخصّص أرخص فقط عند الاستخدام الكامل المستمر؛ أما لأعباء العمل المتقطعة أو الموجهة للمستخدم، فعادةً ما يفوز الدفع حسب الاستخدام على الحافة.