تخطي إلى معلومات المنتج
1 of 7

Kentino المحدودة

K-AI 576 Genoa RTXPro6000 12000TOPS — 6× RTX Pro 6000 Blackwell Server Edition AI Frontier Server

K-AI 576 Genoa RTXPro6000 12000TOPS — 6× RTX Pro 6000 Blackwell Server Edition AI Frontier Server

سعر عادي EUR € 106.069,00
سعر عادي سعر البيع EUR € 106.069,00
تخفيضات نفذت الكمية
شامل الضريبة الشحن يتم احتساب الشحن عند متابعة عملية الشراء.

K-AI 576 Genoa RTXPro6000 12000TOPS

خادم أبحاث فرونتير بسعة 576 جيجابايت من ذاكرة الوصول العشوائي للفيديو ECC
6x RTX Pro 6000 Server Edition | EPYC Genoa | 12000 TOPS INT8

12 000
أفضل 8
576 جيجا بايت
مجموعة ذاكرة الفيديو ECC
BCM
محول PCIe من الجيل الخامس
حدود
البحث المحلي

المراجع الخارجية المنشورة. لم يتم القياس على أجهزة كينتينو.

منصة استدلال متطورة تُثبّت في رفّ 7U، مزودة بست بطاقات NVIDIA RTX Pro 6000 Blackwell Server Edition سلبية، مُجمّعة في ذاكرة فيديو ECC بسعة 576 جيجابايت، ومعالج AMD EPYC 9354 Genoa (32 نواة/64 خيطًا)، وذاكرة DDR5-4800 ECC بسعة 768 جيجابايت (جميع القنوات الـ 12 مُستخدمة)، ووحدة تخزين NVMe بسعة 4 تيرابايت للتشغيل، وخمس وحدات تزويد طاقة للخادم بقدرة 1200 واط لكل منها. تُوزّع مراوح Broadcom PCIe Gen5 المدمجة الحرارة بالتساوي على جميع فتحات بطاقات الرسومات الست. يدعم DeepSeek V3 Q4 (بسعة 404 جيجابايت تقريبًا) معالجة السياقات الطويلة، وKimi-K2 Q2، وMistral Large 3 Q2-Q3 - وهي منصة استدلال متطورة بالكامل في الموقع.

أجهزة التبخير

مكون التفاصيل
وحدات معالجة الرسومات 6x NVIDIA RTX Pro 6000 Blackwell Server Edition 96 GB ECC (سلبي، 600 واط، PCIe 5.0 x16، 2000 INT8 TOPS لكل بطاقة)
مجموعة ذاكرة الوصول العشوائي للفيديو إجمالي 576 جيجابايت عبر 6 بطاقات (بدون NVLink - P2P عبر PCIe Gen5 بسرعة ~55-60 جيجابايت/ثانية لكل اتجاه)
وحدة المعالجة المركزية‏: AMD EPYC 9354 Genoa (32 نواة/64 خيط، 280 واط، 128 مسار PCIe 5.0، 12 قناة DDR5)
اللوحة الأم ASRock Rack GENOAD8X-2T/BCM (SP5 Genoa، مفتاح Broadcom PEX PCIe Gen5 مدمج، 12x DDR5، 2x 10 GbE، IPMI)
ذاكرة الوصول العشوائي للنظام 768 جيجابايت DDR5-4800 ECC RDIMM (12 × 64 جيجابايت - جميع القنوات مشغولة، ~460 جيجابايت/ثانية إجمالية)
صندوق الأمتعة / التخزين محرك أقراص NVMe M.2 بسعة 4 تيرابايت (PCIe 4.0 x4) - مصمم خصيصًا لتجهيز نقاط التفتيش الحدودية
مزود الطاقة مجموعة 5 وحدات تزويد طاقة للخادم بقدرة 1200 واط (متوافقة مع HP، إجمالي 6 كيلو واط)
الهيكل وحدة تثبيت على رف 7U تتسع لـ 8 وحدات معالجة رسومات، سعة 10 فتحات PCIe، رافعات Gen5 نشطة
تبريد مبرد SP5 Genoa البرجي، 8 مراوح هيكلية مقاس 120 مم، يتطلب تدفق هواء من الأمام إلى الخلف في مركز البيانات. بطاقات رسومات سلبية.
الانرنيت منفذان مدمجان بسرعة 10 جيجابت إيثرنت (إنتل X550)

مغلف الطاقة

  • استهلاك وحدة معالجة الرسومات: 6 × 600 واط = 4600 واط
  • إجمالي استهلاك الطاقة للنظام عند الحمل الكامل: ~1825 واط
  • إجمالي قدرة وحدة تزويد الطاقة: 6000 واط (5 × 1200 واط) - هامش أمان بنسبة 32%
  • لا حاجة إلى حد أقصى للطاقة للاستدلال في الحالة المستقرة

طوبولوجيا المسار

تتضمن لوحة GENOAD8X-2T/BCM محول Broadcom PEX PCIe Gen5 مدمجًا. توفر اللوحة 128 مسارًا من الجيل الخامس من معالج EPYC Genoa الرئيسي إلى المحول، والذي يتفرع بشكل متساوٍ إلى جميع فتحات وحدات معالجة الرسومات الست بسرعة Gen5 x16 من طرف إلى طرف عبر وصلات صاعدة نشطة. تتميز اللوحة بتصميم أحادي الجذر بسيط، مما يُسهل ضبط NUMA مقارنةً بالتصميم ثنائي المقابس. لا تدعم اللوحة تقنية NVLink، وتدعم الاتصال من نقطة إلى نقطة بسرعة تتراوح بين 55 و60 جيجابايت/ثانية لكل اتجاه.

ما يمكنك تشغيله

بفضل ذاكرة الوصول العشوائي ECC VRAM المجمعة بسعة 576 جيجابايت على شريحة Blackwell fp8 الأصلية، يقوم هذا الخادم بتشغيل حدود الوزن المفتوح الصينية + الغربية الكاملة في عمليات الكم البحثية: DeepSeek V3 Q4 (~404 جيجابايت) مع سياق طويل، Kimi-K2 Q2، Mistral Large 3 Q2-Q3، GLM-5 Q2، Qwen3-Coder-480B Q4.

ماجستير في القانون - نص / استدلال / برمجة

الحدود الصينية

  • ديب سيك V3 / R1 / V3.1 / V3.2 في الربع الرابع (Q4_K_M) (~404 جيجابايت) مناسب للسياق الطويل (~5-8 توكا/ثانية vLLM TP-6 ​​واحد، مرجع منشور)؛ fp8 أصلي (~670 جيجابايت مع امتداد ذاكرة الوصول العشوائي
  • كيمي-ك2 (الأساس / التعليمات / التفكير) في Q2_K (~375 جيجابايت) مريح (~5-8 توكو/ثانية مرجع واحد منشور)
  • GLM-5 / GLM-5.1 (~745 بايت/44 بايت) في الربع الثاني من عام 2000 (~260 جيجابايت) مريح؛ الربع الثالث (~420 جيجابايت) مع فائض في ذاكرة الوصول العشوائي
  • Qwen3-Coder-480B-A35B في Q4_K_M (~270 جيجابايت) مع سياق طويل
  • Qwen3-235B-A22B في bf16 (~470 جيجابايت) أو fp8 (~240 جيجابايت)
  • ERNIE-4.5-424B-A47B في الربع الرابع (~240 جيجابايت) مع 128 ألف ملف ctx كامل
  • متدرب - السنة الأولى - محترف (1 تيرابايت/22 بايت نشطة، SAGE) في الربع الثاني من عام 2 (~325 جيجابايت) مريح
  • هونيوان-كبير A52B في الربع الرابع (~220 جيجابايت)؛ ميني ماكس-M1 في الربع الرابع (حوالي 260 جيجابايت)

الحدود الغربية

  • ميسترال كبير 3 (675 بايت/41 بايت MoE، Apache 2.0) في الربع الثاني - الربع الثالث (~243-317 جيجابايت) مريح (~20-30 توكا/ثانية واحد، مرجع منشور)
  • لاما 4 مافريك (400B/17B) في Q4_K_M (~232 GB) مع سياق طويل (~45-55 tok/s مرجع واحد منشور)
  • لاما-3.1-نيموترون ألترا 253B في fp8 (~253 جيجابايت) أو bf16 مع امتداد ذاكرة الوصول العشوائي
  • جروك-1 314 بايت في الربع الرابع (~182 جيجابايت)؛ ندفة الثلج في القطب الشمالي في الربع الرابع (حوالي 278 جيجابايت)
  • تعليمات DBRX 132 بايت/36 بايت بسرعة bf16 (~264 جيجابايت) أو fp8 متعدد النسخ
  • جميع طرازات الفئة 70-120B في bf16 مع وجود مساحة احتياطية

نماذج الرؤية واللغة

Qwen3-VL-235B-A22B الرائد VLM؛ InternVL3.5-241B-A28B Q4 (~135 جيجابايت)؛ GLM-4.5V / 4.6V 106B bf16 (~210 جيجابايت)؛ Llama 3.2 90B Vision bf16؛ Pixtral Large 124B fp8؛ Molmo 72B bf16.

توليد الصور

HunyuanImage-3.0 طبقة Instruct (3 × 80 جيجابايت) - تتناسب مع المساحة المتاحة؛ FLUX.1 [dev] / [schnell] / Kontext متعدد النسخ (~15-20 ثانية لكل صورة 1024 × 1024 على RTX Pro 6000 fp8 واحد، مرجع منشور)؛ SD 3.5 كبير؛ SDXL؛ AuraFlow؛ OmniGen؛ HunyuanImage-2.1؛ Kolors 2.0.

توليد الفيديو

Wan 2.2 T2V-A14B / I2V-A14B ثنائي الخبير MoE bf16 (~54 جيجابايت)؛ HunyuanVideo 13B bf16 مريح؛ Open-Sora 2.0 (11B) bf16؛ Mochi-1 (10B) fp16؛ NVIDIA Cosmos Predict 2 حتى 14B؛ CogVideoX-5B؛ LTX-Video؛ Pyramid Flow.

الصوت / الكلام / تحويل النص إلى كلام

مجموعة كاملة مقيمة في وقت واحد: Whisper v3 large، Parakeet-TDT 1.1B، Canary 1B، Moshi 7B realtime، Qwen3-Omni، Step-Audio R1، CosyVoice 3.0، Kokoro، Stable Audio Open.

خدمة متعددة النماذج / متعددة المستأجرين

  • استدلال DeepSeek V3 Q4 + صورة FLUX + فيديو Hunyuan + صوت Whisper/Moshi في الوقت الفعلي، جميعها تعمل في وقت واحد
  • معالجة متزامنة 70 بايت متوازية باستخدام Tensor + 235 بايت باستخدام MoE على نطاقات PCIe منفصلة عبر محول Broadcom
  • تقييم البحث A/B: ثلاثة نماذج حدودية مفتوحة الوزن مقيمة في وقت واحد

أحمال العمل المستهدفة

  • مختبر أبحاث Frontier مفتوح الوزن — إمكانية الوصول المحلي إلى DeepSeek V3 / Kimi-K2 / Mistral Large 3 class بدون خروج سحابي
  • نشر الذكاء الاصطناعي السيادي - إقامة البيانات في الاتحاد الأوروبي باستخدام حزمة نماذج Apache 2.0 / MIT
  • منصة RAG متعددة النماذج للمؤسسات + منصة وكلاء - العديد من نماذج MoE المقيمة التي تتراوح قيمتها بين 200 و400 مليار
  • تقييم النموذج / بحث السلامة الذي يقارن بين الأوزان المفتوحة الصينية الرائدة والأوزان المفتوحة الغربية
  • الاستدلال على نطاق واسع للصناعات الخاضعة للتنظيم والتي تتطلب فجوة هوائية + تصحيح الأخطاء + PCIe Gen5

المراجع المنشورة للأداء

مراجع خارجية | لم يتم القياس على أجهزة كينتينو

مؤشر نتيجة
RTX Pro 6000 لكل بطاقة INT8 TOPS 4000 قمة
vLLM — DeepSeek V3 Q4 على 6x RTX Pro 6000 (مفرد) ~25-40 توكوفيرول/ثانية
vLLM — DeepSeek V3 Q4 على 6x RTX Pro 6000 (الدفعة 32) إجمالي 200-400 توكو/ثانية
FLUX.1 [dev] fp8 على بطاقة رسومات RTX Pro 6000 واحدة حوالي 15-20 ثانية لكل صورة بحجم 1024×1024

تم تأكيد الأرقام الدقيقة في مرحلة إثبات المفهوم. ستنشر شركة كينتينو الأرقام الرسمية بعد إصدار النسخة التجريبية الأولى للعميل.

ليست مثالية لـ

  • Kimi-K2 / DeepSeek V3 في الربع الرابع من العام، خدمة الإنتاج بالسرعة الحقيقية - انتقل إلى محرك الأقراص المزدوج Turin بسعة 768 جيجابايت
  • التدريب من الصفر على نماذج من الفئة الرائدة - بدون NVLink، PCIe P2P فقط
  • نشر سهل وسريع - تحتاج وزارة التعليم في المناطق الحدودية التي تخدمها إلى فريق عمليات تعلم آلي ماهر

الضمان ومدة التسليم

2 سنة
ضمان قطع الغيار
عام واحد
ضمان العمل
10-28 أيام
المهلة

تتضمن عملية التجميع، وتكوين BIOS، وتثبيت برامج التشغيل، واختبار الأداء، واختبار الذاكرة، والتحقق الوظيفي، وإعداد بيئة LLM (vLLM / SGLang / llama.cpp / CUDA 13 stack مع نواة Blackwell fp8). يعتمد وقت التسليم على توفر المكونات، ويتم تأكيده عند الطلب.

الإضافات الموصى بها

  • بطاقة الشبكة NVIDIA ConnectX-5 MCX555A-ECAT بسرعة 100 جيجابت إيثرنت لتوسيع نطاق الشبكة متعددة العقد
  • وحدة تخزين ثانية بسعة 4 تيرابايت من نوع NVMe لمكتبة البيانات/النماذج
  • خزانة رف كاملة 24U بباب أمامي مثقب
  • مزود طاقة غير منقطع (UPS) عبر الإنترنت بقدرة 10 كيلو فولت أمبير
  • وحدة توزيع الطاقة المُدارة
عرض التفاصيل الكاملة