تخطي إلى معلومات المنتج
1 of 7

Kentino المحدودة

K-AI 384 Rome RTXPro6000 — 4× RTX Pro 6000 Blackwell Server Edition (384 GB ECC VRAM)

K-AI 384 Rome RTXPro6000 — 4× RTX Pro 6000 Blackwell Server Edition (384 GB ECC VRAM)

سعر عادي EUR € 46.583,00
سعر عادي سعر البيع EUR € 46.583,00
تخفيضات نفذت الكمية
شامل الضريبة الشحن يتم احتساب الشحن عند متابعة عملية الشراء.

K-AI 384 Rome RTXPro6000 8000TOPS

خادم مركز بيانات بسعة 384 جيجابايت من ذاكرة الوصول العشوائي للفيديو ECC
4x RTX Pro 6000 Server Edition | EPYC Milan | 8000 TOPS INT8

8 000
أفضل 8
384 جيجا بايت
مجموعة ذاكرة الفيديو ECC
fp8
ابن بلاكويل
سلبي
تبريد مركز البيانات

المراجع الخارجية المنشورة. لم يتم القياس على أجهزة كينتينو.

خادم استدلال يُثبّت في رفّ بحجم 4U، مزوّد بأربع بطاقات NVIDIA RTX Pro 6000 Blackwell Server Edition سلبية لمراكز البيانات (سعة كل منها 96 جيجابايت ECC) مُجمّعة في ذاكرة وصول عشوائي للفيديو (VRAM) بسعة 384 جيجابايت ECC، ومعالج AMD EPYC 7643 Milan (48 نواة/96 خيطًا)، وذاكرة DDR4-2666 ECC بسعة 384 جيجابايت، ووحدة تخزين NVMe بسعة 2 تيرابايت للتشغيل، ووحدتي تزويد طاقة ATX متزامنتين بقدرة 2.5 كيلو واط. يستخدم معالج Blackwell بتقنية تسريع fp8 الأصلية. يتميز بتبريد سلبي مُوجّه بتدفق الهواء لهيكل مركز البيانات. يدعم تشغيل DeepSeek V3 Q3 وMistral Large 3 وQwen3-Coder-480B وجميع نماذج Frontier الرئيسية مفتوحة الوزن.

أجهزة التبخير

مكون التفاصيل
وحدات معالجة الرسومات 4x NVIDIA RTX Pro 6000 Blackwell Server Edition 96 GB ECC (مبرد مركز بيانات سلبي، 600 واط TGP، PCIe 5.0 x16، 2000 INT8 TOPS/card، fp8 أصلي)
مجموعة ذاكرة الوصول العشوائي للفيديو 384 جيجابايت إجمالية ECC موزعة على 4 بطاقات
وحدة المعالجة المركزية‏: AMD EPYC 7643 Milan (48 نواة/96 خيط، 225 واط، 128 مسار PCIe 4.0)
اللوحة الأم ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI)
ذاكرة الوصول العشوائي للنظام 384 جيجابايت DDR4-2666 ECC RDIMM (6 × 64 جيجابايت - فتحتان DIMM متاحتان للترقية إلى 512 جيجابايت)
صندوق الأمتعة / التخزين 2 تيرابايت NVMe M.2 (PCIe 4.0 x4)
مزود الطاقة 2x 2.5 كيلو واط ATX مع كابل مزامنة مزدوج لوحدة تزويد الطاقة (5 كيلو واط إجمالي)
الهيكل 4U مثبت على الرف
تبريد مبرد SP3 البرجي (فئة Arctic Freezer 4U-M) + تدفق هواء موجه من الأمام إلى الخلف (3 فتحات سحب أمامية 120 مم + فتحة طرد خلفية 120 مم). بطاقات معالجة الرسومات السلبية - تتطلب تدفق هواء مناسب لهيكل مركز البيانات.
الانرنيت منفذان مدمجان بسرعة 10 جيجابت إيثرنت (إنتل X550)

مغلف الطاقة

  • استهلاك وحدة معالجة الرسومات: 4 × 600 واط = 4600 واط
  • إجمالي استهلاك الطاقة للنظام تحت الحمل الكامل: ~2175 واط
  • إجمالي قدرة وحدة تزويد الطاقة: 5000 واط (وحدتان متزامنتان بقدرة 2.5 كيلو واط) - هامش أمان بنسبة 44.5%
  • مزود طاقة مزدوج لتوزيع الطاقة بشكل منفصل - تعطل مزود طاقة واحد = فقدان وحدتي معالجة رسومية أو وحدتي معالجة رسومية بالإضافة إلى اللوحة الأم

طوبولوجيا المسار

توفر اللوحة الأم ROMED8-2T سبعة منافذ PCIe 4.0 x16 مباشرة من معالج EPYC Milan. أربعة منافذ منها مُشغّلة، وثلاثة أخرى متاحة لبطاقات الشبكة/التخزين/القياس عن بُعد. معالج الرسوميات RTX Pro 6000 من الجيل الخامس، ويعمل بكامل طاقته (الجيل الرابع x16) على هذه المنصة، ما يضمن عدم وجود أي اختناق في عرض النطاق الترددي للاستدلال. لا يوجد محول PCIe. لا يوجد NVLink.

ما يمكنك تشغيله

بفضل ذاكرة الوصول العشوائي ECC VRAM المجمعة بسعة 384 جيجابايت على شريحة Blackwell fp8 الأصلية، يقوم هذا الخادم بتشغيل DeepSeek V3 / R1 بسرعة Q3 بشكل مريح على البطاقة، وMistral Large 3 Q3، وGLM-5 Q3، وQwen3-Coder-480B Q3، وLlama 3.3 70B bf16 الموجودة على بطاقة واحدة (96 جيجابايت/بطاقة).

ماجستير في القانون - نص / استدلال / برمجة

الحدود الصينية

  • ديب سيك V3 / V3-0324 / V3.1 / V3.2 / R1 / R1-0528 الربع الثالث (حوالي 290 جيجابايت) بشكل مريح على البطاقة (حوالي 30-40 توك/ثانية، مرجع منشور)؛ أصلي بتقنية fp8 (حوالي 670 جيجابايت مع امتداد ذاكرة الوصول العشوائي
  • Qwen3-Coder-480B-A35B الربع الثالث (حوالي 350 جيجابايت مضغوطة مع تجاوز ذاكرة الوصول العشوائي) - وكيل ترميز مفتوح المصدر SOTA (حوالي 18-25 توكا/ثانية مرجع واحد منشور)
  • Qwen3-235B-A22B الربع السادس/الربع الثامن (حوالي 200-280 جيجابايت) مع سياق طويل جدًا ومعالجة دفعية متعددة المستخدمين
  • GLM-5 / GLM-5.1 الربع الثالث (~317 جيجابايت) - حدود الصين، قريب من كلود أوبوس 4.6 في البرمجة
  • كيمي-ك2 1.58 بت UD (~240 جيجابايت) - وكيل ذو تريليون معلمات بمعدل نقل بيانات حقيقي
  • هونيوان-كبير 389B/52B الربع الرابع (~220 جيجابايت)، fp8 أصلي (~390 جيجابايت فائض)
  • ERNIE-4.5-424B-A47B الربع الرابع (~240 جيجابايت)؛ ميني ماكس-M1 الربع الرابع (~260 جيجابايت) 1 ميجابايت-ctx
  • اللاما 3.3 70 ب bf16 مقيم على بطاقة واحدة (96 جيجابايت/بطاقة - لا حاجة إلى tensor-parallel)

الحدود الغربية

  • ميسترال كبير 3 (675B/41B MoE, Apache 2.0) الربع الثالث (~317 جيجابايت) — أوزان مفتوحة غربية حدودية (~20-30 توكو/ثانية مفردة، مرجع منشور)
  • لاما 4 مافريك (400B/17B) الربع الرابع (~232 جيجابايت) مع ميزانية KV سخية (~45-55 توكا/ثانية مرجع منشور واحد)
  • لاما-3.1-نيموترون ألترا 253B الربع السادس - الربع الثامن (حوالي 119-207 جيجابايت)
  • gpt-oss-120b يدعم MXFP4 الأصلي (80 جيجابايت) مع مساحة هائلة للأسطول المتزامن
  • بيسترال كبير / ميسترال كبير 2 bf16 (~248 جيجابايت)؛ ديفسترال 2 123B bf16 — 256k top open coding
  • اللاما 3.3 70 ب bf16 على بطاقة واحدة؛ إمكانية نشر 70B في وقت واحد 4 مرات

نماذج الرؤية واللغة

Qwen3-VL-235B-A22B bf16 (~240 جيجابايت)؛ InternVL3.5-241B-A28B Q4 (~135 جيجابايت)؛ Llama 3.2 90B Vision bf16؛ Pixtral Large 124B bf16 (~248 جيجابايت)؛ Qwen3-Omni-30B-A3B؛ Molmo 72B؛ ERNIE-4.5-VL؛ GLM-4.6V 106B bf16 على TP. يوفر Blackwell fp8 إنتاجية تزيد بمقدار الضعف تقريبًا في استدلال برج الرؤية مقارنةً بـ Ada.

توليد الصور

FLUX.1 [dev] / Kontext / Tools بسرعة fp8 أصلية (~15-20 ثانية لكل صورة 1024x1024 على بطاقة RTX Pro 6000 واحدة، مرجع منشور)؛ SD 3.5 Large؛ HunyuanImage-2.1 (17 بايت أصلية 2K)؛ HunyuanImage-3.0 80 بايت/13 بايت MoE؛ AuraFlow؛ OmniGen؛ 4x عمال ComfyUI متزامنين.

توليد الفيديو

Wan 2.2 T2V-A14B / I2V-A14B ثنائي الخبير bf16؛ HunyuanVideo 13B bf16 كلا الخبيرين؛ Open-Sora 2.0 (11B) bf16؛ CogVideoX-5B؛ Mochi-1؛ LTX-Video؛ Pyramid Flow؛ SVD / SV3D / SV4D؛ NVIDIA Cosmos Predict 2.

الصوت / الكلام / تحويل النص إلى كلام

  • ASR: Whisper v3 كبير / توربو؛ Parakeet-TDT 1.1B؛ Canary 1B؛ Qwen3-ASR؛ SenseVoice
  • تحويل النص إلى كلام: CosyVoice 2/3؛ Kokoro؛ Stable Audio Open؛ XTTS v2؛ Step-Audio-EditX
  • في الوقت الحقيقي / من جهاز لآخر: كيوتاي موشي؛ خطوة الصوت 2 ميني / R1؛ Qwen2.5-أومني-7B
  • الموسيقى / المؤثرات الصوتية: MusicGen / AudioGen / Bark / SeamlessM4T

خدمة متعددة النماذج / متعددة المستأجرين

  • DeepSeek V3 Q3 + متزامن 70B + FLUX.1 + Whisper all resident
  • نظام متوازي رباعي الاتجاهات من نوع Tensor على فئة 350-400B في الربع الرابع
  • عزل المستأجرين لكل بطاقة - بطاقة واحدة من نوع Llama 3.3 بسعة 96 جيجابايت و70 بايت bf16 لكل بطاقة، و4 وحدات استدلال مستقلة
  • نظام RAG متعدد النماذج: قارئ + مُعيد ترتيب + رؤية + مُضمّن، كل ذلك على مضيف واحد

أحمال العمل المستهدفة

  • واجهة استدلال Frontier ذات الأوزان المفتوحة — DeepSeek V3 Q3، Qwen3-Coder-480B Q3، GLM-5 Q3
  • خدمة إنتاج وكلاء لاما 4 مافريك Q4 متعددي الوسائط مع ميزانية سياق سخية
  • عزل 4 مستأجرين لكل بطاقة - بطاقة Llama 3.3 70B bf16 واحدة لكل مستأجر، بدون أي تلوث متبادل
  • تقنية ديب سيك الأصلية fp8 / R1 / هونيوان تعمل على شريحة بلاكويل
  • ميسترال لارج 3 Q3 كبديل مفتوح الوزن لـ Western Apache-2.0 الحدودي

المراجع المنشورة للأداء

مراجع خارجية | لم يتم القياس على أجهزة كينتينو

مؤشر نتيجة
RTX Pro 6000 لكل بطاقة INT8 TOPS 4000 قمة
عرض نطاق الذاكرة لبطاقة RTX Pro 6000 سرعة نقل البيانات حوالي 1800 جيجابايت/ثانية لكل بطاقة
vLLM — DeepSeek V3 Q3 على 4x Blackwell PCIe (مفرد) ~30-40 توكوفيرول/ثانية
vLLM — DeepSeek V3 Q3 على 4x Blackwell PCIe (الدفعة 8) إجمالي حوالي 200 توكو/ثانية
SGLang — Llama 4 Maverick Q4 on 4x Blackwell (single) ~45-55 توكوفيرول/ثانية
llama.cpp — Qwen3-Coder-480B Q3 على 4x Blackwell (مفرد) ~18-25 توكوفيرول/ثانية
FLUX.1 [dev] fp8 على بطاقة رسومات RTX Pro 6000 واحدة حوالي 1.8 ثانية لكل صورة بحجم 1024×1024

ستقوم شركة كينتينو بنشر الأرقام الخاصة بها بعد إصدار النسخة التجريبية الأولية للعملاء.

ليست مثالية لـ

  • أحمال عمل المستخدم الواحد التي تصل إلى 70 مليار عملية - يُعد استخدام 4 بطاقات RTX 5090 أرخص بكثير لمجموعة تخزين بسعة 128 جيجابايت إذا لم تكن هناك حاجة إلى تصحيح الأخطاء ECC والموثوقية السلبية
  • تركيب هادئ في المختبرات/المكاتب المجاورة - يتطلب نظام التبريد السلبي تدفق هواء مناسب من الأمام إلى الخلف في مركز البيانات. بالنسبة للمواقع الحساسة للصوت، اختر طراز Max-Q المزود بمروحة توربينية (K-AI 384 Rome RTXPro6000MQ).
  • التدريب على تقنية فرونتير من الصفر (بدون نظام NVLink)
  • بطاقة DeepSeek V3 Q4 كاملة مدمجة (~404 جيجابايت) — ترقية إلى 6x RTX Pro 6000 / 576 جيجابايت

الضمان ومدة التسليم

3 سنة
ضمان وحدة معالجة الرسومات الأصلية من NVIDIA
2 سنة
ضمان قطع الغيار
عام واحد
ضمان العمل
10-28 أيام
المهلة

تشمل عملية التجميع، وتكوين نظام الإدخال والإخراج الأساسي (BIOS)، وتثبيت برامج التشغيل، واختبار الأداء، واختبار الذاكرة، والتحقق من الوظائف. يعتمد وقت التسليم على توافر المكونات، ويتم تأكيده عند الطلب.

الإضافات الموصى بها

  • قم بترقية ذاكرة الوصول العشوائي (RAM) إلى 512 جيجابايت من نوع DDR4 (أضف وحدتين سعة كل منهما 64 جيجابايت - فتحتان DIMM متاحتان) لتوفير مساحة إضافية لذاكرة الوصول العشوائي في أجهزة Q3 Frontier Quanter.
  • 4 تيرابايت NVMe Gen4 x4 لمكتبة نماذج الحدود (يبلغ حجم DeepSeek V3 Q3 وحده حوالي 290 جيجابايت على القرص)
  • خزانة رف كاملة بحجم 24U مع وحدة توزيع طاقة مُدارة + وحدة تزويد طاقة غير منقطعة متصلة بالإنترنت
  • تصميم بديل: نسخة Max-Q المزودة بمروحة توربينية (K-AI 384 Rome RTXPro6000MQ) - نفس السيليكون، ولكن بمروحة تبريد أكثر هدوءًا، للاستخدام في المختبرات.
عرض التفاصيل الكاملة