Kentino المحدودة
K-AI 192 Rome ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milan (طلب مسبق)
K-AI 192 Rome ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milan (طلب مسبق)
تعذر تحميل توفر الاستلام
قيد الإعداد
الطلب المسبق — من المتوقع شحن لوحة Intel Arc Pro B70 في الربع الثالث من عام 2026
K-AI 192 Rome ArcProB70 TBD
خادم استدلال Intel Xe2 بسعة 192 جيجابايت من ذاكرة الوصول العشوائي للفيديو
6x Arc Pro B70 | EPYC Milan | TOPS TBD
جهاز كمبيوتر اقتصادي ذو ذاكرة وصول عشوائي عالية للفيديو، مصمم خصيصًا لحزمة الاستدلال مفتوحة المصدر من إنتل. السعر ثابت حسب توفر المنتج لدى إنتل.
خادم استدلال يُثبّت في رفّ بحجم 4U، مزوّد بستّ بطاقات Intel Arc Pro B70 Creator (سعة كلّ منها 32 جيجابايت من نوع Xe2-HPG "Battlemage"، بإجمالي 192 جيجابايت)، ومعالج AMD EPYC 7643 Milan (48 نواة/96 خيطًا)، وذاكرة DDR4 ECC بسعة 384 جيجابايت، ووحدة تخزين NVMe بسعة 2 تيرابايت للتشغيل، ووحدة تزويد طاقة ATX بقدرة 2 كيلوواط (يُنصح بشدّة بترقية وحدة تزويد الطاقة إلى اثنتين). مُصمّم للعمل مع بيئة برمجيات Intel: OpenVINO 2025+، وIPEX-LLM، وواجهة llama.cpp SYCL الخلفية، ونسخ vLLM-Intel المُعدّلة. لا تعمل أحمال العمل التي تعتمد على CUDA فقط على هذا الجهاز.
أجهزة التبخير
| مكون | التفاصيل |
|---|---|
| وحدات معالجة الرسومات | 6x Intel Arc Pro B70 Creator 32 GB (Xe2-HPG "Battlemage", 250 W, PCIe 5.0 x16, dual-slot) |
| مجموعة ذاكرة الوصول العشوائي للفيديو | إجمالي 192 جيجابايت عبر 6 بطاقات (بدون بنية بين البطاقات - حركة مرور النظراء عبر PCIe) |
| وحدة المعالجة المركزية: | AMD EPYC 7643 Milan (48 نواة/96 خيط، 225 واط، 128 مسار PCIe 4.0) |
| اللوحة الأم | ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI) |
| ذاكرة الوصول العشوائي للنظام | 384 جيجابايت DDR4-2666 ECC RDIMM (6 × 64 جيجابايت) |
| صندوق الأمتعة / التخزين | 2 تيرابايت NVMe M.2 (PCIe 4.0 x4) |
| مزود الطاقة | وحدة تزويد طاقة ATX واحدة بقدرة 2 كيلو واط (يوصى بشدة بترقية متزامنة ثنائية بقدرة 2 كيلو واط) |
| الهيكل | وحدة تثبيت على رف 4U (تصميم بستة فتحات) |
| تبريد | مبرد برج SP3 (Arctic Freezer 4U-M) + تدفق هواء موجه من الأمام إلى الخلف (مراوح صناعية) |
| الانرنيت | منفذان مدمجان بسرعة 10 جيجابت إيثرنت (إنتل X550) |
مغلف الطاقة
- استهلاك الطاقة لوحدة معالجة الرسومات: 6 × 250 واط = 1500 واط (الاستهلاك الحراري للطاقة المنشور من قبل شركة إنتل)
- إجمالي استهلاك الطاقة للنظام عند الحمل الكامل: ~1825 واط
- إجمالي قدرة وحدة تزويد الطاقة: 2000 واط (مفردة) - هامش أمان بنسبة 8.75% فقط
- يوصى بشدة باستخدام مكبرات صوت مزدوجة بقدرة 2 كيلو واط متزامنة - مما يعيد حوالي 45% من نطاق الطاقة المتاح
طوبولوجيا المسار
توفر لوحة ROMED8-2T سبعة مسارات PCIe 4.0 x16. ستة منافذ مُشغّلة، وواحدة متاحة لترقية بطاقة الشبكة. لوحة Arc Pro B70 متوافقة مع PCIe Gen5، بينما تعمل ROMED8-2T بتقنية Gen4، مما يجعل تأثيرها على عرض النطاق الترددي ضئيلاً عند استخدام 32 جيجابايت لكل بطاقة. لا يوجد محول PCIe، ولا يوجد ما يُعادل Xe-Link.
ما يمكنك تشغيله
جميع ادعاءات التوافق تخص مسارات حزمة برامج Intel (OpenVINO، IPEX-LLM، llama.cpp SYCL، vLLM-Intel). لا تعمل أحمال العمل التي تعتمد على CUDA فقط على هذا الجهاز. جميع الأرقام مستندة إلى مصادر خارجية منشورة وتخضع للتحقق المستقل عند شحن البطاقات.
ماجستير في القانون - نص / استدلال / برمجة
الحدود الصينية
- Qwen3 / Qwen3.5 (علي بابا): Qwen3-235B-A22B Q4 (~132 جيجابايت) مع مساحة تخزين سياقية طويلة؛ Qwen3-Coder-480B-A35B Q2 (~160 جيجابايت)؛ Qwen3.5-397B-A17B Q3 (~170 جيجابايت)
- GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 جيجابايت) — متوافق مع KV متوسط
- تينسنت هونيوان: Hunyuan-Large Q3 (~160 جيجابايت)؛ Hunyuan-A13B fp8 (حوالي 80 جيجابايت) إذا تم الكشف عن مسار Xe2 fp8 في برنامج التشغيل
- أخرى: بايدو ERNIE-4.5-424B الربع الثالث (~180 جيجابايت)؛ ميني ماكس-M1 الربع الثالث (~180 جيجابايت)؛ ديب سيك-R2 32B (6 تدفقات متزامنة)
الحدود الغربية
- ميتا لاما: لاما 3.3 70B Q6-Q8 مع KV سخي؛ لاما 4 سكاوت 109B/17B Q4 (~63 جيجابايت) مريحة
- ميسترال: ميسترال صغير 3 / ماجيسترال صغير / ديفسترال صغير 2 (24B) في bf16؛ بيكسرال كبير Q4-Q6
- OpenAI (الأوزان المفتوحة): gpt-oss-120b MXFP4 الأصلي (~80 جيجابايت) — إذا كان فكّ كمية MXFP4 متاحًا في حزمة Intel
- إنفيديا نيموترون: Llama-3.1-Nemotron Ultra 253B Q4 (~120 جيجابايت)
- أخرى: جيما 3 27B bf16 متعدد الوسائط؛ فاي-4 / فاي-4-استدلال 14B؛ أمر كوهير R+ 104B Q4
نماذج الرؤية واللغة
Qwen3-VL-8B / 32B؛ Qwen3-VL-30B-A3B MoE؛ InternVL3 حتى 78B؛ InternVL3.5-38B؛ Llama 3.2 90B Vision Q4؛ Pixtral 12B؛ Molmo 72B Q4؛ Gemma 3 12B/27B متعدد الأنماط؛ MiniCPM-V 2.6 / MiniCPM-o 2.6. يتمتع OpenVINO من Intel بدعم قوي لتقنية Vision-tower - VLM هي نقطة قوة محتملة منذ اليوم الأول.
توليد الصور
FLUX.1 [dev] / [schnell] fp8 أو Q4 GGUF عبر llama.cpp SYCL؛ SDXL / SD 3.5 كبير عبر وقت تشغيل OpenVINO genAI؛ HunyuanDiT; HunyuanImage-2.1 bf16 (~34 جيجابايت)؛ كولورز 2.0؛ أورا فلو; أومنيجين؛ بيكس آرت سيجما.
توليد الفيديو
Wan 2.2 T2V-A14B / I2V-A14B MoE (~54 جيجابايت bf16)؛ Wan 2.2 TI2V-5B؛ HunyuanVideo 13B bf16؛ HunyuanVideo 1.5؛ CogVideoX-5B؛ Open-Sora 2.0؛ LTX-Video؛ Pyramid Flow؛ Mochi-1 Q4. يُعدّ الفيديو أضعف مسار Intel حاليًا - توقع أن يكون فعالًا ولكن ليس بأفضل إنتاجية عند الشحن.
الصوت / الكلام / تحويل النص إلى كلام
- ASR: Whisper v3 كبير/مُعزز عبر OpenVINO (دعم Intel Whisper من الدرجة الأولى)؛ Parakeet-TDT؛ Canary؛ SenseVoice
- تحويل النص إلى كلام: CosyVoice 2/3؛ Kokoro 82M؛ Stable Audio Open؛ XTTS v2؛ StyleTTS 2؛ Step-Audio-EditX
- في الوقت الحقيقي / من جهاز لآخر: كيوتاي موشي؛ MusicGen / AudioGen / النباح؛ SeamlessM4T v2
خدمة متعددة النماذج / متعددة المستأجرين
- ستة تدفقات متزامنة من طراز Q4 بسعة 32 جيجابايت (تدفق واحد لكل بطاقة) - على سبيل المثال، 6 وكلاء Qwen3-32B Q4
- دمج الأسطول على نطاق واسع - 6x تدفقات متوازية BGE-M3 / E5 / Nomic Embed (محسّنة لـ OpenVINO)
- الإقامة المختلطة — 70B الربع الرابع (متوازية الموترات على 3 بطاقات) + FLUX.1 (بطاقة واحدة) + Whisper-turbo (بطاقة واحدة) + Moshi (بطاقة واحدة)
أحمال العمل المستهدفة
- تجربة تقييم برمجيات إنتل لبرنامج ماجستير القانون البديل لـ CUDA
- نظام خلفي للتضمين/إعادة الترتيب حيث يهيمن معدل نقل البيانات لكل يورو على متطلبات الإنتاجية
- استدلال حدود الميزانية للربع الرابع (Qwen3-235B، GLM-4.5/4.6/4.7) لفرق التطوير الداخلية الصغيرة
- نشر نموذج OpenVINO الأصلي جنبًا إلى جنب مع خطوط أنابيب Intel Xeon / Arc Pro الحالية
- نظام معالجة المستندات VLM / OCR (نقطة قوة OpenVINO من Intel)
الأداء المقاس
المواصفات المنشورة من قبل إنتل | تخضع للتحقق المستقل عند شحن البطاقات
| المواصفات | بعد التخفيض |
|---|---|
| ذاكرة الوصول العشوائي للفيديو لكل بطاقة | شنومكس غب غدرسنومكس |
| فئة عرض نطاق الذاكرة | سرعة نقل البيانات حوالي 450 جيجابايت/ثانية لكل بطاقة |
| ملحقات Xe Matrix (XMX) | تم تسريعها عبر OpenVINO / IPEX-LLM |
| مسار fp8 | سيليكون Xe2 - التحقق من تعرض السائق للضوء وقت الشحن |
لا توجد بيانات مُقاسة من قِبل كينتينو. تخضع المواصفات المنشورة من قِبل إنتل للتحقق المستقل. ستنشر كينتينو أرقامًا خاصة بها لـ tok/s / QPS / عرض النطاق الترددي بمجرد اجتياز الوحدة الأولى لاختبارات التحمل.
ليست مثالية لـ
- أحمال العمل الأصلية لـ CUDA — لا يوجد CUDA على معالجات Intel، توقع صعوبات في عملية الترحيل
- عمليات النشر بالغة الأهمية لاتفاقيات مستوى الخدمة في الإنتاج حتى استقرار إمدادات Intel Arc Pro والأدوات
- Frontier 600B+ MoE في الربع الرابع وما بعده (يتطلب 6x RTX Pro 6000 / 576 GB pool)
- أحمال التدريب - يعتمد Arc Pro على الاستدلال أولاً، ونضج إطار العمل للتدريب الموزع محدود.
- للعملاء الذين يحتاجون إلى معايير قياس محددة قبل الشراء — هذا المنتج متاح للطلب المسبق
الضمان ومدة التسليم
ضمان كينتينو القياسي (سنتان للأجزاء، وسنة واحدة لليد العاملة)؛ تسري شروط توزيع إنتل في حال وجود شروط أكثر صرامة. تشمل عملية التجميع، وتكوين BIOS، وتثبيت برامج التشغيل، واختبار التشغيل الأولي، والتحقق من الأداء. احجز موعدك في الدفعة الأولى من خلال نموذج الاتصال الخاص بكينتينو. فترة تأكيد السعر 30 يومًا عند الطلب.
الإضافات الموصى بها
- ترقية وحدة تزويد الطاقة المزدوجة المتزامنة بقدرة 2 كيلو واط (الحد الأقصى لاستهلاك الطاقة لوحدة تزويد الطاقة الواحدة ضيق عند سحب 1825 واط - يوصى به بشدة)
- قم بترقية ذاكرة الوصول العشوائي إلى 512 جيجابايت DDR4 (2 × 64 جيجابايت - فتحتان متاحتان)
- محرك أقراص ثانوي NVMe بسعة 4 تيرابايت لمكتبة النماذج
مشاركة
