تخطي إلى معلومات المنتج
1 of 7

Kentino المحدودة

K-AI 192 Turin2U RTXPro6000 4000TOPS — 2× RTX Pro 6000 Blackwell Server Edition — 2U Turin SP5

K-AI 192 Turin2U RTXPro6000 4000TOPS — 2× RTX Pro 6000 Blackwell Server Edition — 2U Turin SP5

سعر عادي EUR € 56.600,00
سعر عادي سعر البيع EUR € 56.600,00
تخفيضات نفذت الكمية
شامل الضريبة الشحن يتم احتساب الشحن عند متابعة عملية الشراء.

K-AI 192 Turin2U RTXPro6000 4000TOPS

زوج بلاكويل فلاجشيب بسعة 192 جيجابايت بتقنية ECC
بطاقتا رسومات RTX Pro 6000 Server Edition | معالج EPYC Turin SP5 | 4000 TOPS INT8

4 000
أفضل أجهزة INT8
192 جيجا بايت
ذاكرة الفيديو ECC
بلاكويل
fp8 الأصلي
2 بطاقة
الحد الأدنى من نقاط التكنولوجيا

بطاقتان سلبيتان من نوع RTX Pro 6000 Blackwell Server Edition، سعة كل منهما 96 جيجابايت ECC. تتميزان بانخفاض الحمل الزائد للمعالجة المتوازية مقارنةً بتكوينات من 4 أو 8 بطاقات. زوج من البطاقات الرائدة لمراكز البيانات على منصة Gen5/DDR5 2U مع طاقة احتياطية حقيقية 1+1.

خادم استدلال يُثبّت في رفّ بحجم 2U، مزوّد ببطاقتي رسومات RTX Pro 6000 Blackwell Server Edition (سعة 96 جيجابايت من نوع ECC GDDR7 لكل بطاقة)، ​​ومعالج AMD EPYC 9335 Turin (32 نواة/64 خيطًا، 3.0/4.4 جيجاهرتز)، وذاكرة وصول عشوائي DDR5-4800 ECC بسعة 512 جيجابايت، ووحدة تخزين بيانات Gen5 NVMe بسعة 5.76 تيرابايت، ووحدة تزويد طاقة CRPS احتياطية بقدرة 2.7 كيلوواط حاصلة على شهادة 80+ Platinum. يبدأ السعر من 56,600 يورو (غير شامل ضريبة القيمة المضافة). بالنسبة لخوارزميات bf16 ذات الكثافة العالية (70 بايت) وخوارزميات MoE متوسطة الحجم، يُفضّل استخدام عدد أقل من البطاقات الكبيرة على استخدام عدد أكبر من البطاقات الصغيرة، حيث يتميّز التوازي الموتري باستخدام بطاقتين بأقل قدر من تكاليف الاتصال، وتحمل كل بطاقة بسعة 96 جيجابايت نسخة كاملة من معظم النماذج.

يأتي هذا الجهاز مزودًا بنفس ذاكرة Blackwell بسعة 192 جيجابايت الموجودة في جهاز Rome ذي الأربع وحدات، ضمن هيكل ASRock ذي كثافة تخزين عالية (2U) مع ذاكرة DDR5-4800 من الجيل الخامس (Gen5) على جانب المضيف، ووحدة تزويد طاقة بلاتينية CRPS احتياطية بقدرة 2.7 كيلوواط (1+1). اختر هذا الجهاز عندما تكون كثافة التخزين مهمة، أو عندما تتطلب مواصفات المنحة أو المشتريات منصة PCIe 5.0 / DDR5 حديثة، أو عندما تكون الطاقة الاحتياطية شرطًا أساسيًا وليست مجرد ميزة إضافية.

أجهزة التبخير

مكون التفاصيل
وحدات معالجة الرسومات 2x NVIDIA RTX Pro 6000 Blackwell Server Edition 96 GB ECC GDDR7 (سلبي، 600 واط، PCIe 5.0 x16، فتحة مزدوجة)
مجموعة ذاكرة الوصول العشوائي للفيديو 192 جيجابايت ECC (96 جيجابايت × 2) - كل بطاقة تحتوي على ذاكرة مستقلة من طراز bf16 بسعة 70 بايت
وحدة المعالجة المركزية‏: AMD EPYC 9335 Turin (32 نواة/64 خيط، 3.0/4.4 جيجاهرتز، 210 واط، SP5، 128 مسار PCIe 5.0، Zen5c، 256 ميجابايت L3)
اللوحة الأم ASRock Rack 2U4G-GENOA/M3 (SP5, 4x PCIe 5.0 x16 dual-slot GPU, 8x DDR5 1DPC, OCP 3.0, IPMI AST2600)
ذاكرة الوصول العشوائي للنظام 512 جيجابايت DDR5-4800 ECC RDIMM (8 × 64 جيجابايت، 1DPC ممتلئ بالكامل - تكوين أقصى عرض نطاق ترددي)
صندوق الأمتعة / التخزين Kioxia CD8-P سعة 3.84 تيرابايت من الجيل الخامس U.3 (طبقة ساخنة، عملية كتابة بيانات كاملة واحدة يوميًا، سرعة قراءة ~12 جيجابايت/ثانية) + Kioxia CD8-P سعة 1.92 تيرابايت من الجيل الخامس U.3 (طبقة نظام التشغيل) -- إجمالي سعة تخزين مركز البيانات 5.76 تيرابايت من الجيل الخامس NVMe
مزود الطاقة وحدة تزويد طاقة احتياطية 1+1 بقدرة 2.7 كيلوواط، حاصلة على شهادة 80+ بلاتينيوم CRPS (2 × 1350 واط عند 230 فولت) - توفر تكرارًا حقيقيًا من نوع N+1؛ حيث تتحمل وحدة تزويد الطاقة الواحدة حمل التداخل الكامل.
الهيكل وحدة تثبيت في رف 2U مع تدفق هواء موجه من الأمام إلى الخلف (مراوح 80 مم ذات ضغط ثابت عالٍ). تعمل على مدار الساعة طوال أيام الأسبوع.
تبريد مشتت حراري نشط لوحدة المعالجة المركزية SP5 + 3 فتحات أمامية للتهوية بحجم 80x38 مم + فتحة خلفية واحدة للتهوية بحجم 80x80 مم (مصمم لحمل حراري سلبي لوحدة معالجة الرسومات 4x؛ يوفر تصميم البطاقتين مساحة حرارية كافية)
الانرنيت يتوفر منفذ Intel X710-T2L PCIe مزدوج 10GBASE-T + OCP 3.0 لترقية 25/100 جيجابت إيثرنت

مغلف الطاقة

  • استهلاك وحدة معالجة الرسومات: 2 × 600 واط = 1200 واط
  • إجمالي استهلاك الطاقة للنظام عند الحمل الكامل: ~1825 واط
  • تكوين وحدة تزويد الطاقة: 1+1 وحدة تزويد طاقة احتياطية، 2 × 1350 واط عند 230 فولت (إجمالي 2700 واط)
  • هامش الأمان: 44.1% تحت حمل الاستدلال النموذجي
  • نظام تكرار حقيقي N+1 - وحدة تزويد طاقة واحدة تتحمل حمل الاستدلال الكامل؛ لا يوجد خطر فشل وحدة تزويد طاقة واحدة

طوبولوجيا المسار

اتصال PCIe Gen5 x16 متكامل - يدعم كل من المضيف والبطاقة الجيل الخامس الأصلي. اتصال مباشر بين وحدة المعالجة المركزية والشبكة، بدون محول PCIe. يتوفر منفذ PCIe 5.0 x16 أحادي الفتحة ومنفذ PCIe 5.0 x8 (تشغل بطاقة الشبكة منفذ x8). لا يدعم NVLink - اتصال مباشر بين وحدات معالجة الرسومات عبر PCIe. يلغي عرض النطاق الترددي للجيل الخامس حد عرض النطاق الترددي للمضيف للجيل الرابع الموجود في جهاز Rome الشقيق بحجم 4U.

ما يمكنك تشغيله

بفضل ذاكرة الفيديو ECC بسعة 192 جيجابايت على بطاقتي Blackwell فقط مع دعم أصلي لـ fp8/fp4، يُعد هذا المسار الأمثل لتحقيق كثافة بيانات 70 بايت عند bf16 وMoE متوسط ​​الحجم. مساران مستقلان لبيانات 70 بايت - واحد لكل بطاقة - أو MoE بسعة 200 بايت موزعة على البطاقتين مع الحد الأدنى من الحمل الزائد لـ TP ثنائي الاتجاه.

ماجستير في القانون - نص / استدلال / برمجة

الحدود الصينية

  • Qwen3 / Qwen3.5 (علي بابا): Qwen3-235B-A22B Q4 (بسعة 132 جيجابايت تقريبًا) مناسب للعمل مع ملفات ctx طويلة (بمعدل 15-25 tok/ثانية تقريبًا في تدفق واحد عبر بطاقتين)؛ Qwen3-Coder-480B-A35B Q2 (بسعة 160 جيجابايت تقريبًا)؛ Qwen3.5-122B-A10B fp8 (بسعة 75 جيجابايت تقريبًا)؛ Qwen3-32B بكثافة bf16 مع KV ضخم؛ QwQ-32B bf16
  • ديب سيك: DeepSeek-V3/R1 Q2 (~215 جيجابايت مع فائض بسيط في ذاكرة الوصول العشوائي) -- يعمل Blackwell بنظام fp8 بشكل أصلي؛ DeepSeek-R2 32B bf16 تدفقان متزامنان (واحد لكل بطاقة)
  • GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 الربع الرابع (~177 جيجابايت) - التكوين الأمثل في هذه الفئة؛ GLM-4.5-Air fp8 أو bf16 مع KV ضخم
  • تينسنت هونيوان: Hunyuan-Large Q3 (~160 جيجابايت) -- 389 بايت MoE مع 256 ألف سياق؛ Hunyuan-A13B fp8 أصلي (~80 جيجابايت) مع KV ضخم
  • أخرى: بايدو إيرني-4.5-424B Q3 ​​(~180 جيجابايت)؛ InternVL3.5-241B-A28B Q4 (~135 جيجابايت)؛ MiniMax-M1 Q3 (~180 جيجابايت)

الحدود الغربية

  • ميتا لاما: لاما 3.3 70 بايت bf16 على بطاقة واحدة - تدفقان مستقلان متزامنان 70 بايت (~20-30 توكا/ثانية لكل تدفق)؛ لاما 4 سكاوت bf16 (~218 جيجابايت، مضغوطة)؛ لاما 4 مافريك Q3 (~188 جيجابايت)
  • ميسترال: ميسترال لارج 2 / بيكسرال لارج / ديفسترال 2 123B Q6 (~88 جيجابايت) بطاقة واحدة أو bf16 عبر كليهما؛ ميسترال سمول 3 متعدد التدفقات
  • OpenAI (الأوزان المفتوحة): gpt-oss-120b MXFP4 الأصلي (80 جيجابايت) - يناسب بطاقة واحدة، تدفقان متزامنان مستقلان
  • إنفيديا نيموترون: لاما-3.1-نيموترون ألترا 253B الربع الرابع (~147 جيجابايت)؛ سوبر 49B bf16 على بطاقة واحدة
  • أخرى: Cohere Command R+ 104B Q6 (~85 جيجابايت) على بطاقة واحدة؛ Google Gemma 3 27B bf16 تدفقات متزامنة متعددة

نماذج الرؤية واللغة

InternVL3.5-241B-A28B Q4 (~135 جيجابايت)؛ Qwen3-VL-235B-A22B Q4؛ Qwen3-VL-32B bf16 بطاقة واحدة؛ Pixtral Large 124B bf16 أو Q6؛ Llama 3.2 90B Vision bf16 (~180 جيجابايت)؛ Molmo 72B bf16 (~144 جيجابايت)؛ GLM-4.6V 106B fp8؛ Gemma 3 27B متعدد الوسائط x 2-3 تدفقات متزامنة.

توليد الصور

FLUX.1 [dev] bf16 تدفقات متزامنة متعددة؛ FLUX.1 Kontext [dev]؛ أدوات FLUX؛ بطاقة SD 3.5 كبيرة bf16 متزامنة؛ HunyuanImage-2.1 bf16 (~34 جيجابايت) × 2-4 متزامنة؛ HunyuanImage-3.0 الأساسي (80 بايت MoE، 13 بايت نشط) bf16 -- يناسب بطاقة واحدة؛ HunyuanDiT؛ Kolors / Kolors 2.0؛ AuraFlow؛ OmniGen v1؛ PixArt-Sigma.

توليد الفيديو

Wan 2.2 MoE ثنائي الخبير bf16 سياق كامل - يناسب بطاقة واحدة، تدفقان توليد متزامنان؛ Wan 2.2 TI2V-5B؛ HunyuanVideo 13B bf16 كلا الخبيرين؛ HunyuanVideo 1.5؛ CogVideoX-5B bf16؛ Open-Sora 2.0 11B bf16؛ Mochi-1 bf16 (~42 جيجابايت)؛ LTX-Video؛ Pyramid Flow؛ SVD / SV3D / SV4D؛ NVIDIA Cosmos Predict 2.

الصوت / الكلام / تحويل النص إلى كلام

  • ASR: Whisper v3 كبير / توربو (حوالي 50 ضعف الوقت الفعلي)؛ Parakeet-TDT؛ Canary 1B؛ Qwen3-ASR؛ SenseVoice
  • تحويل النص إلى كلام: CosyVoice 2/3؛ Kokoro 82M؛ XTTS v2؛ Stable Audio Open؛ Step-Audio-EditX
  • في الوقت الحقيقي / من جهاز لآخر: كيوتاي موشي 7 ب؛ خطوة الصوت 2 ميني/R1؛ Qwen2.5-أومني-7B
  • الموسيقى / المؤثرات الصوتية: MusicGen / AudioGen / Bark؛ SeamlessM4T الإصدار 2

خدمة متعددة النماذج / متعددة المستأجرين

  • تدفقان مستقلان بسعة 70 بايت - واحد لكل بطاقة، وهو أبسط شكل لعزل المستأجرين
  • ذاكرة كثيفة 70 بايت bf16 + حزمة داعمة -- LLM على البطاقة 1، صور/فيديو/صوت على البطاقة 2
  • 200B MoE عبر البطاقتين - الحد الأدنى من النفقات العامة المتوازية للموتر (تقسيم ثنائي الاتجاه)
  • حدود fp8 الأصلية -- عائلة DeepSeek V3، Hunyuan-Large fp8 مع مسارات Blackwell الأصلية

أحمال العمل المستهدفة

  • استدلال كثيف 70 بايت bf16 - بطاقتان متوازيتان موتريًا بأقل قدر من الحمل الزائد، أو نموذج واحد لكل بطاقة للبث المباشر
  • 100-150 مليار وحدة طاقة في الربع الرابع - الربع السادس (GLM-4.5-Air، Qwen3.5-122B-A10B، Hunyuan-A13B، Llama 4 Scout)
  • الاستدلال الحدودي الأصلي لـ FP8 (عائلة DeepSeek V3، وHunyuan، وLlama 4) -- يدعم Blackwell تقنية FP8 بشكل أصلي
  • الحوسبة العلمية التي تتطلب إنتاجية من نوع Gen5 NVMe وذاكرة ECC على مستوى مراكز البيانات
  • استوديو توليد الصور والفيديو في bf16 (Wan 2.2 T2V-A14B، HunyuanVideo 13B، FLUX.1 [dev])
  • عمليات النشر ذات القيود على كثافة الرفوف - عامل الشكل 2U مقابل عامل الشكل 4U Rome المكافئ له بنفس ذاكرة الوصول العشوائي للفيديو
  • مواصفات الشراء التي تشترط منصة PCIe 5.0 / DDR5 أو وحدة تزويد طاقة احتياطية

الأداء المقاس

المراجع المنشورة | ورقة بيانات NVIDIA RTX Pro 6000 Blackwell Server Edition + معايير الأداء المجتمعية

مؤشر نتيجة
معدل نقل البيانات لكل بطاقة 8 بت في الثانية (بيانات NVIDIA) 4000 قمة
مجموع نقاط INT8 الأعلى (بطاقتان) 4000 قمة
عرض نطاق الذاكرة لكل بطاقة سرعة نقل بيانات تبلغ حوالي 1800 جيجابايت/ثانية، وذاكرة تخزين داخلية من نوع ECC GDDR7 بسعة 96 جيجابايت
لاما 3.3 70B bf16 لكل بطاقة (مجتمعية) 15-25 توكا/ثانية للتدفق الفردي، 60-90 توكا/ثانية للدفعة - تحسن متوقع من مسار الذاكرة على جانب المضيف من الجيل الخامس في أحمال عمل الدفعات المتدفقة مقارنةً بمضيف الجيل الرابع
ميزة جانب المضيف في الجيل الخامس (بطاقة واحدة بنفس السيليكون) يقلل منفذ PCIe 5.0 x16 من زمن انتقال البيانات بين المضيف والجهاز لأحمال العمل الدفعية المتدفقة؛ وتشهد المهام الحسابية على البطاقة إنتاجية مماثلة لعمليات البناء المستضافة على الجيل الرابع.
بطاقة مزدوجة متوازية موتر 70B (مجتمعية) من المتوقع تدفق أحادي يتراوح بين 30 و45 توكا/ثانية
بلاكويل fp8 الأصلي DeepSeek-V3 fp8 و Hunyuan-A13B fp8 يعملان بدون بث bf16

البيانات منشورة من مصادر خارجية، ولم يتم قياسها على أجهزة كينتينو. ستنشر كينتينو بياناتها الخاصة بعد أول إصدار للعميل.

ليست مثالية لـ

  • خدمة متعددة المستأجرين ذات تزامن عالٍ جدًا -- توزيع أفضل على عدد أكبر من البطاقات باستخدام 4x L40 أو 6x L4
  • ذاكرة تخزين مؤقتة ثقيلة للقيم والقيم في سياق طويل جدًا - انتقل إلى K-AI 576 Genoa RTXPro6000 12000TOPS
  • التدريب -- لا تبيع شركة كينتينو أقمشة NVLink من الفئة H
  • استنتاج الميزانية في مجموعة ذاكرة الوصول العشوائي للفيديو هذه - يُعدّ بناء 4U Rome K-AI 192 RTXPro6000 4000TOPS أقل تكلفة إذا كان جانب المضيف من الجيل الرابع مقبولًا ولم تكن هناك حاجة إلى تكرار وحدة تزويد الطاقة

الضمان ومدة التسليم

2 سنة
ضمان قطع الغيار
عام واحد
ضمان العمل
14-21 أيام
المهلة

ضمان NVIDIA الأصلي لمدة 3 سنوات على بطاقة RTX Pro 6000 Server Edition، بالإضافة إلى ضمان لمدة 36 شهرًا على الهيكل، وضمان تكامل Kentino. تشمل عملية التجميع: تركيب BIOS/البرامج الثابتة، وإعداد IPMI، وتثبيت برامج التشغيل، واختبارات التحمل، والتحقق من الأداء. مدة التسليم من 14 إلى 21 يوم عمل، وهي مدة تعكس طلبية الموزعين لمكونات فئة Turin، ويتم تأكيدها عند تقديم الطلب.

الإضافات الموصى بها

  • يمكن توسيع التكوين إلى 4 بطاقات - يحتوي الهيكل على 4 فتحات لوحدات معالجة الرسومات (يستخدم التكوين الحالي 2 من أصل 4)، مسار الترقية إلى K-AI 384 Turin2U RTXPro6000 8000TOPS
  • أضف 25 جيجابت إيثرنت أو 100 جيجابت إيثرنت عبر فتحة OCP 3.0 (إصدار Mellanox ConnectX-5/6 OCP)
  • إضافة وحدة تخزين Kioxia CD8-P NVMe في فتحتي U.2 المتبقيتين لإنشاء RAID أو تخزين مؤقت.
  • قم بترقية مستوى التخزين إلى Samsung PM1743 أو Kioxia CM7-V للحصول على قدرة تحمل أعلى (3 DWPD).
  • خزانة رفية 24U + وحدة تزويد طاقة غير منقطعة (UPS) متصلة بالإنترنت بقدرة 5 كيلو فولت أمبير
عرض التفاصيل الكاملة