Kentino المحدودة
K-AI 576 Genoa RTXPro6000MQ 12000TOPS — 6× RTX Pro 6000 Blackwell Max-Q AI Frontier Server
K-AI 576 Genoa RTXPro6000MQ 12000TOPS — 6× RTX Pro 6000 Blackwell Max-Q AI Frontier Server
تعذر تحميل توفر الاستلام
K-AI 576 Genoa RTXPro6000MQ 12000TOPS
خادم Frontier بسعة 576 جيجابايت من ذاكرة الوصول العشوائي للفيديو ECC
6 مراوح توربينية RTX Pro 6000 Max-Q | معالج EPYC Genoa | 12000 TOPS INT8
المراجع الخارجية المنشورة. لم يتم القياس على أجهزة كينتينو.
منصة استدلال متطورة تُثبّت في رفّ 7U، تضم ست بطاقات NVIDIA RTX Pro 6000 Blackwell Max-Q مزودة بمروحة توربينية، مُجمّعة في ذاكرة فيديو ECC بسعة 576 جيجابايت، ومعالج AMD EPYC 9354 Genoa (32 نواة/64 خيطًا)، وذاكرة DDR5-4800 ECC بسعة 768 جيجابايت (جميع القنوات الـ 12 مُستخدمة)، ووحدة تخزين NVMe بسعة 4 تيرابايت للتشغيل، وخمس وحدات تزويد طاقة للخادم بقدرة 1200 واط. تستخدم نفس مكونات السيليكون والذاكرة المستخدمة في إصدار الخادم السلبي، ولكن مع مُبرّد مختلف. تتميز مروحة Max-Q التوربينية بأنها مُستقلة لكل بطاقة، وتعمل بهدوء أكبر، وتتحمل تدفق هواء أقل صرامة داخل الهيكل. يُطابق تصميمها الخارجي تصميم الإصدار السلبي.
أجهزة التبخير
| مكون | التفاصيل |
|---|---|
| وحدات معالجة الرسومات | 6x NVIDIA RTX Pro 6000 Blackwell Max-Q 96 GB ECC (مروحة توربينية، مواصفات TDP 600 واط، PCIe 5.0 x16، 2000 INT8 TOPS لكل بطاقة) |
| مجموعة ذاكرة الوصول العشوائي للفيديو | إجمالي 576 جيجابايت عبر 6 بطاقات (بدون NVLink - P2P عبر PCIe Gen5 بسرعة ~55-60 جيجابايت/ثانية لكل اتجاه) |
| وحدة المعالجة المركزية: | AMD EPYC 9354 Genoa (32 نواة/64 خيط، 280 واط، 128 مسار PCIe 5.0، 12 قناة DDR5) |
| اللوحة الأم | ASRock Rack GENOAD8X-2T/BCM (SP5 Genoa، مفتاح Broadcom PEX PCIe Gen5 مدمج، 12x DDR5، 2x 10 GbE، IPMI) |
| ذاكرة الوصول العشوائي للنظام | 768 جيجابايت DDR5-4800 ECC RDIMM (12 × 64 جيجابايت - جميع القنوات مشغولة، ~460 جيجابايت/ثانية إجمالية) |
| صندوق الأمتعة / التخزين | محرك أقراص NVMe M.2 بسعة 4 تيرابايت (PCIe 4.0 x4) - مصمم خصيصًا لتجهيز نقاط التفتيش الحدودية |
| مزود الطاقة | مجموعة 5 وحدات تزويد طاقة للخادم بقدرة 1200 واط (متوافقة مع HP، إجمالي 6 كيلو واط) |
| الهيكل | وحدة تثبيت على رف 7U تتسع لـ 8 وحدات معالجة رسومات، سعة 10 فتحات PCIe، رافعات Gen5 نشطة |
| تبريد | مبرد SP5 Genoa البرجي + 8 مراوح هيكلية مقاس 120 مم. مراوح التوربينية لكل وحدة معالجة رسومية مستقلة بذاتها - يُنصح باستخدام تدفق هواء مناسب لمراكز البيانات، ولكنه ليس شرطًا أساسيًا. أكثر هدوءًا لبيئات المختبرات. |
| الانرنيت | منفذان مدمجان بسرعة 10 جيجابت إيثرنت (إنتل X550) |
مغلف الطاقة
- استهلاك الطاقة لوحدة معالجة الرسومات (حسب المواصفات): 6 × 600 واط = 3600 واط
- إجمالي استهلاك الطاقة للنظام عند الحمل الكامل المحدد: ~4080 واط
- إجمالي قدرة وحدة تزويد الطاقة: 6000 واط (5 × 1200 واط) - هامش أمان بنسبة 32%
- تستهلك بطاقات Max-Q عادةً طاقة مستدامة تتراوح بين 520 و550 واط - مع هامش فعلي يزيد عن 20%
التبريد (مُفرِّق Max-Q)
تسحب كل بطاقة الهواء من الأمام إلى الخلف عبر منفاخها الخاص - وحدة مستقلة لكل بطاقة. تتحمل التركيب في رفوف مختلطة أو خزائن مفتوحة. أكثر هدوءًا من مجموعة مراوح محورية مماثلة. يُفضل ملف تعريف برنامج Max-Q استهلاكًا منخفضًا للطاقة (520-550 واط نموذجيًا). يُوصى باستخدام خزانة ذات باب أمامي مثقب ومسار عادم خلفي واضح.
ما يمكنك تشغيله
مطابق تمامًا لإصدار الخادم الشقيق - نفس الشريحة، ونفس سعة التخزين 576 جيجابايت. DeepSeek V3 الربع الرابع (~404 جيجابايت) مع سياق طويل، Kimi-K2 الربع الثاني، Mistral Large 3 الربع الثاني - الربع الثالث، GLM-5 الربع الثاني، Qwen3-Coder-480B الربع الرابع.
ماجستير في القانون - نص / استدلال / برمجة
الحدود الصينية
- ديب سيك V3 / R1 / V3.1 / V3.2 في الربع الرابع (Q4_K_M) (~404 جيجابايت) مناسب للسياق الطويل (~5-8 توكا/ثانية vLLM TP-6 واحد، مرجع منشور)؛ fp8 أصلي (~670 جيجابايت مع امتداد ذاكرة الوصول العشوائي
- كيمي-ك2 (الأساس / التعليمات / التفكير) في Q2_K (~375 جيجابايت) مريح (~5-8 توكو/ثانية مرجع واحد منشور)
- GLM-5 / GLM-5.1 (~745B/44B) في Q2_K (~260 جيجابايت)؛ Q3 (~ 420 جيجابايت) مع انسكاب ذاكرة الوصول العشوائي
- Qwen3-Coder-480B-A35B في Q4_K_M (~270 جيجابايت) مع سياق طويل
- Qwen3-235B-A22B في bf16 (~470 جيجابايت) أو fp8 (~240 جيجابايت)
- ERNIE-4.5-424B-A47B في الربع الرابع (~240 جيجابايت) مع 128 ألف ملف ctx
- متدرب - السنة الأولى - محترف في الربع الثاني من عام 2 (~325 جيجابايت)؛ هونيوان-كبير في الربع الرابع (حوالي 220 جيجابايت)
- MiniMax-Text-01 / M1 في الربع الرابع (حوالي 260 جيجابايت)
الحدود الغربية
- ميسترال كبير 3 في الربع الثاني - الربع الثالث (~243-317 جيجابايت) مريح (~20-30 توكا/ثانية للوحدة، مرجع منشور)
- لاما 4 مافريك في Q4_K_M (~232 جيجابايت) مع سياق طويل (~45-55 توكا/ثانية مرجع واحد منشور)
- لاما-3.1-نيموترون ألترا 253B في fp8 (~253 جيجابايت)
- جروك-1 314 بايت في الربع الرابع (~182 جيجابايت)؛ ندفة الثلج في القطب الشمالي في الربع الرابع (حوالي 278 جيجابايت)
- تعليمات DBRX 132 بايت/36 بايت عند bf16 (~264 جيجابايت) أو fp8
نماذج الرؤية واللغة
Qwen3-VL-235B-A22B؛ InternVL3.5-241B-A28B Q4؛ GLM-4.5V / 4.6V 106B bf16؛ Llama 3.2 90B Vision bf16؛ Pixtral Large 124B fp8؛ Molmo 72B bf16.
توليد الصور
HunyuanImage-3.0 Instruct؛ FLUX.1 [dev] / [schnell] / Kontext multi-instance (~15-20 ثانية لكل صورة 1024x1024، مرجع منشور)؛ SD 3.5 Large؛ SDXL؛ AuraFlow؛ OmniGen؛ HunyuanImage-2.1؛ Kolors 2.0.
توليد الفيديو
Wan 2.2 T2V-A14B ثنائي الخبير MoE bf16؛ HunyuanVideo 13B bf16؛ Open-Sora 2.0 (11B)؛ Mochi-1 (10B)؛ NVIDIA Cosmos Predict 2 حتى 14B؛ CogVideoX-5B؛ LTX-Video؛ Pyramid Flow.
الصوت / الكلام / تحويل النص إلى كلام
مجموعة كاملة من البرامج المقيمة: Whisper v3 large، Parakeet-TDT 1.1B، Canary 1B، Moshi 7B realtime، Qwen3-Omni، Step-Audio R1، CosyVoice 3.0، Kokoro، Stable Audio Open.
خدمة متعددة النماذج / متعددة المستأجرين
- DeepSeek V3 Q4 + FLUX + HunyuanVideo + Whisper/Moshi في الوقت الفعلي، جميعها مقيمة
- معالجة متزامنة 70 بايت متوازية باستخدام الموترات + 235 بايت باستخدام MoE على نطاقات PCIe منفصلة
- ثلاثة نماذج رائدة للتقييم A/B
أحمال العمل المستهدفة
- مختبر أبحاث فرونتير مفتوح الوزن ذو بنية تحتية لتدفق هواء مختلط / غير مثالي
- مراكز البيانات المشتركة / مراكز البيانات الخاصة حيث يكون استخدام التوربينات المروحية لكل بطاقة أبسط تشغيليًا من تدفق الهواء السلبي الكامل
- نشر الذكاء الاصطناعي السيادي باستخدام حزمة نماذج Apache 2.0 / MIT
- منصة وكلاء متعددة النماذج للمؤسسات RAG +
- بيئات المختبرات ذات الرفوف المفتوحة
المراجع المنشورة للأداء
مراجع خارجية | نفس السيليكون المستخدم في إصدار الخادم | لم يتم القياس على أجهزة كينتينو
| مؤشر | نتيجة |
|---|---|
| RTX Pro 6000 لكل بطاقة INT8 TOPS | 4000 قمة |
| vLLM — DeepSeek V3 Q4 على 6x RTX Pro 6000 (مفرد) | ~25-40 توكوفيرول/ثانية |
| vLLM — DeepSeek V3 Q4 على 6x RTX Pro 6000 (الدفعة 32) | إجمالي 200-400 توكو/ثانية |
| FLUX.1 [dev] fp8 على بطاقة رسومات RTX Pro 6000 واحدة | حوالي 15-20 ثانية لكل صورة بحجم 1024×1024 |
تم تأكيد الأرقام الدقيقة في مرحلة إثبات المفهوم. ستنشر شركة كينتينو الأرقام الرسمية بعد إصدار النسخة التجريبية الأولى للعميل.
ليست مثالية لـ
- Kimi-K2 / DeepSeek V3 في الربع الرابع من العام جاهزية الإنتاج بالسرعة الحقيقية - انتقل إلى K-AI 768 TurinDual RTXPro6000MQ
- التدريب من الصفر على نماذج من الفئة الرائدة - بدون NVLink
- نشر سهل وسريع - تحتاج وزارة التعليم في المناطق الحدودية التي تخدمها إلى فريق عمليات تعلم آلي ماهر
الضمان ومدة التسليم
تتضمن عملية التجميع، وتكوين نظام الإدخال والإخراج الأساسي (BIOS)، وتثبيت برامج التشغيل، واختبار الأداء، واختبار الذاكرة، والتحقق الوظيفي، وإعداد بيئة LLM. يعتمد وقت التسليم على توفر المكونات، ويتم تأكيده عند الطلب.
الإضافات الموصى بها
- بطاقة الشبكة NVIDIA ConnectX-5 MCX555A-ECAT بسرعة 100 جيجابت إيثرنت لتوسيع نطاق الشبكة متعددة العقد
- وحدة تخزين ثانية بسعة 4 تيرابايت من نوع NVMe لمكتبة البيانات/النماذج
- خزانة رف كاملة 24U بباب أمامي مثقب
- مزود طاقة غير منقطع (UPS) عبر الإنترنت بقدرة 10 كيلو فولت أمبير
- وحدة توزيع الطاقة المُدارة
مشاركة
