Kentino المحدودة
K-AI 256 TurinDual 5090 — 8× RTX 5090 Dual-Socket Zen5c Flagship (اطلب عرض سعر للمعالج)
K-AI 256 TurinDual 5090 — 8× RTX 5090 Dual-Socket Zen5c Flagship (اطلب عرض سعر للمعالج)
تعذر تحميل توفر الاستلام
K-AI 256 TurinDual 5090 13408TOPS
خادم استدلال رائد بسعة 256 جيجابايت من ذاكرة الوصول العشوائي للفيديو
8 بطاقات رسومات RTX 5090 | معالجين EPYC Turin | 13408 تيرابايت في الثانية (INT8)
تم تحديد أسعار وحدة المعالجة المركزية عند الطلب - يتحرك سوق سلسلة Turin 9005 أسبوعيًا في الربع الثاني من عام 2026.
المراجع الخارجية المنشورة. لم يتم القياس على أجهزة كينتينو.
خادم استدلال رائد يُثبّت في رفّ بحجم 7U، مزوّد بثمانية معالجات رسومات GeForce RTX 5090 (ذاكرة 32 جيجابايت GDDR7، Blackwell، fp8 أصلية) على منصة EPYC Turin ثنائية المقبس (Zen5c، SP5) مع ذاكرة DDR5-4800 ECC بسعة 768 جيجابايت موزّعة على جميع القنوات الـ 12، ووحدة تخزين NVMe بسعة 2 تيرابايت للتشغيل، وخمس وحدات تزويد طاقة للخادم بقدرة 1200 واط لكل منها. يدعم PCIe Gen5 بالكامل على وحدة معالجة الرسومات عبر وصلات إعادة التوقيت/إعادة التوجيه النشطة. يشغل vLLM وSGLang وllama.cpp وComfyUI وجميع حزم الاستدلال الرئيسية مفتوحة المصدر مباشرةً.
أجهزة التبخير
| مكون | التفاصيل |
|---|---|
| وحدات معالجة الرسومات | 8x NVIDIA GeForce RTX 5090 32 GB GDDR7 (Blackwell, 575 W TGP, PCIe 5.0 x16, fp8 native, 1676 INT8 TOPS/card) |
| مجموعة ذاكرة الوصول العشوائي للفيديو | إجمالي 256 جيجابايت عبر 8 بطاقات (لا يوجد NVLink على بطاقة RTX 5090 المخصصة للمستهلكين) |
| وحدة المعالجة المركزية: | معالجين من سلسلة AMD EPYC Turin 9005 (Zen5c، SP5، PCIe 5.0) — السعر قيد الانتظار عند الطلب |
| اللوحة الأم | ASRock Rack TURIN2D24XGM/500W (منفذان SP5، PCIe 5.0، 24x DDR5 DIMM) |
| ذاكرة الوصول العشوائي للنظام | 768 جيجابايت DDR5-4800 ECC RDIMM (12 × 64 جيجابايت - جميع القنوات الـ 12 مشغولة؛ تبقى 12 فتحة للتوسيع إلى 1.5 تيرابايت) |
| صندوق الأمتعة / التخزين | 2 تيرابايت NVMe M.2 (PCIe 4.0 x4) |
| مزود الطاقة | مجموعة 5 وحدات تزويد طاقة للخادم بقدرة 1200 واط (متوافقة مع HP، إجمالي 6 كيلو واط) |
| الهيكل | 7U 8-GPU (حتى 10 فتحات PCIe، فتحات منفصلة لوحدة تزويد الطاقة) |
| تبريد | مبردين برجيين من طراز SP5 + نظام تهوية أمامي-خلفي مثبت على الرف (مراوح صناعية) |
| الناهضون | 8 منافذ PCIe Gen5 x16 نشطة (مُعيد توقيت/مُعيد تشغيل) - من الجيل الخامس إلى النهاية |
| الانرنيت | منفذ إيثرنت بسرعة 10 جيجابت مدمج (يعتمد على نوع اللوحة) |
مغلف الطاقة
- استهلاك وحدة معالجة الرسومات: 8 × 575 واط = 4600 واط
- إجمالي استهلاك الطاقة للنظام عند الحمل الكامل: ~1825 واط
- إجمالي قدرة وحدة تزويد الطاقة: 6000 واط (5 × 1200 واط) - هامش أمان بنسبة 8% عند المواصفات
- يأتي جهاز Kentino مزودًا بقدرة قصوى لوحدة معالجة الرسومات تبلغ 500 واط - ينخفض الإجمالي إلى حوالي 4920 واط (حوالي 15٪ هامش إضافي).
طوبولوجيا المسار
يوفر نظام Dual Turin مسارين PCIe Gen5 من الجيل الخامس (2 × 128 = 256) على جانب المضيف. تنقل وصلات Gen5 النشطة بيانات Gen5 x16 من طرف إلى طرف عند كل وحدة معالجة رسومية (GPU) - لا حاجة إلى محول PCIe (معالج واحد لكل مجموعة من 4 بطاقات). لا يدعم NVLink؛ اتصال P2P بين وحدات معالجة الرسوميات بسرعة Gen5 x16 (سرعة اسمية تبلغ حوالي 60 جيجابايت/ثانية لكل وصلة).
ما يمكنك تشغيله
مع 256 جيجابايت من ذاكرة الوصول العشوائي للفيديو المجمعة عبر 8 بطاقات Blackwell مع fp8 الأصلي، يستهدف هذا الخادم معيار 235-480B MoE في الربع الرابع مع سياق حقيقي، وعائلة DeepSeek V3 في الربع الثاني، وKimi-K2 1.58 بت ديناميكي-كمي عند معدل نقل البيانات الحقيقي.
ماجستير في القانون - نص / استدلال / برمجة
الحدود الصينية
- Qwen3-235B-A22B (تعليمات / تفكير / "2507") الربع الرابع (~132 جيجابايت) مع سياق طويل + تجميع متعدد المستخدمين (~25-40 توكا/ثانية تدفق واحد على 8x RTX 5090، مرجع منشور)
- GLM-4.5 / 4.6 / 4.7 الربع الرابع (~177 جيجابايت) - معالجة/برمجة رائدة، 200 ألف سياق على 4.6+
- GLM-5 / GLM-5.1 الربع الثاني (حوالي 260 جيجابايت) مع امتداد طفيف للذاكرة العشوائية - ترميز رائد قريب من Claude Opus 4.6
- DeepSeek V3 / R1 / V3.1 / V3.2 / V3.2-Speciale الربع الثاني (~215 جيجابايت) بسرعة استدلال مفيدة (~28 توكا/ثانية تدفق واحد على 8x بلاكويل، مرجع منشور)
- كيمي-ك2 1.58 بت UD-TQ1_0 (~240 جيجابايت) — وكيل ذو تريليون معلمة بمعدل نقل حقيقي للرموز (~7-10 رمز/ثانية تدفق واحد، مرجع منشور)
- هونيوان-كبير 389B/52B MoE Q4 (~220 GB)؛ ERNIE-4.5-424B-A47B الربع الرابع (~240 جيجابايت)
- Qwen3-Coder-480B-A35B الربع الرابع (حوالي 270 جيجابايت مع وجود فائض في ذاكرة الوصول العشوائي) - أحدث إصدار من برنامج مفتوح المصدر
- MiniMax-M1 / Text-01 سياق الربع الرابع (~260 جيجابايت) مليون؛ Qwen3.5-397B-A17B الربع الرابع (~214 جيجابايت)
الحدود الغربية
- ميسترال كبير 3 (675 مليار/41 مليار وحدة طاقة احتياطية، أباتشي 2.0) الربع الثالث (حوالي 317 جيجابايت مع التجاوز) - أوزان فتح الحدود الغربية
- لاما 4 مافريك (400 بايت/17 بايت، 128 خبيرًا) الربع الرابع (~232 جيجابايت) متعدد الوسائط
- لاما-3.1-نيموترون ألترا 253B الربع الرابع (~119 جيجابايت) — يُعادل حجم DeepSeek-R1 بنصف الحجم
- gpt-oss-120b ذاكرة MXFP4 أصلية (80 جيجابايت) تتسع لعدة طرازات بشكل مريح
- ديفسترال 2 123B (معدل من MIT) Q6 — أعلى مستوى في البرمجة المفتوحة، 256 كيلوبايت ctx
- اللاما 3.3 70 ب bf16 (~142 GB) خدمة متعددة المستأجرين (~30-40 tok/s تدفق واحد لكل زوج RTX 5090 TP2، مرجع منشور)
نماذج الرؤية واللغة
Qwen3-VL-235B-A22B كامل bf16 (حوالي 240 جيجابايت على البطاقة)؛ InternVL3.5-241B-A28B (حوالي 135 جيجابايت Q4)؛ Llama 3.2 90B Vision bf16؛ Pixtral Large 124B bf16 (حوالي 248 جيجابايت مضغوطة)؛ Qwen3-Omni-30B-A3B؛ Molmo 72B؛ ERNIE-4.5-VL؛ GLM-4.6V كامل. يوفر مسار Blackwell fp8 إنتاجية مضاعفة تقريبًا في استدلال برج الرؤية مقارنةً بـ Ada.
توليد الصور
FLUX.1 [dev] / Kontext / Tools full bf16 (~10-18 ثانية/صورة بمعدل fp8 لكل بطاقة، مرجع منشور)؛ SD 3.5 Large؛ HunyuanImage-2.1 (17 بايت، دقة أصلية 2K)؛ HunyuanImage-3.0 80 بايت/13 بايت MoE؛ AuraFlow؛ OmniGen؛ مزارع ComfyUI متعددة العمال.
توليد الفيديو
Wan 2.2 T2V-A14B / I2V-A14B ثنائي الخبير bf16 (كلاهما عالي الضوضاء + منخفض الضوضاء في وقت واحد)؛ HunyuanVideo 13B bf16 كلا الخبيرين؛ Open-Sora 2.0 (11B) bf16؛ CogVideoX-5B؛ Mochi-1؛ LTX-Video؛ Pyramid Flow؛ SVD / SV3D / SV4D؛ NVIDIA Cosmos Predict 2.
الصوت / الكلام / تحويل النص إلى كلام
- ASR: Whisper v3 كبير / توربو (حوالي 50 ضعف الوقت الفعلي)؛ Parakeet-TDT 1.1B؛ Canary 1B؛ Qwen3-ASR؛ SenseVoice
- تحويل النص إلى كلام: CosyVoice 2 / 3؛ Kokoro؛ Stable Audio Open؛ XTTS v2؛ Step-Audio-EditX
- في الوقت الحقيقي / من جهاز لآخر: كيوتاي موشي؛ خطوة الصوت 2 ميني / R1؛ Qwen2.5-أومني-7B
- الموسيقى / المؤثرات الصوتية: MusicGen؛ AudioGen؛ Bark؛ SeamlessM4T v2
خدمة متعددة النماذج / متعددة المستأجرين
- بوابة استدلال الحدود — أكثر من 200 مليار نقطة بيانات + 70 مليار نقطة بيانات متزامنة + صور + فيديو، جميعها مقيمة
- معالجة متوازية ثمانية الاتجاهات باستخدام الموترات لـ Kimi-K2 / DeepSeek V3 في سياق حقيقي
- واجهة برمجة تطبيقات إدارة التعلم متعددة المستأجرين — 50-100 مستخدم متزامن على 235 مليار في الربع الرابع عبر vLLM/SGLang
- إقامة كاملة في الصين وأخرى في الغرب في آن واحد لأغراض التقييم والمقارنة المعيارية
أحمال العمل المستهدفة
- نظام Frontier الخلفي للاستدلال مفتوح الوزن لمؤسسة تضم من 100 إلى 500 مستخدم، يجمع بين Qwen3-235B وGLM-4.5+ وDeepSeek V3 Q2
- منصة Kimi-K2 1.58 بت للوكلاء عند معدل إنتاجية الإنتاج (استخدام الأداة، أكثر من 200 مكالمة متسلسلة)
- معالج DeepSeek V3 / R1 كامل الدقة fp8 يعمل على شريحة Blackwell
- رأس تدريب متعدد العقد مزود بنسيج Gen5 100 GbE / InfiniBand
- مزرعة استدلال ونشر ثنائية الدور (Qwen3-235B + FLUX.1 + HunyuanVideo 13B في وقت واحد)
المراجع المنشورة للأداء
مراجع خارجية | لم يتم القياس على أجهزة كينتينو
| مؤشر | نتيجة |
|---|---|
| RTX 5090 لكل بطاقة INT8 TOPS | 4000 قمة |
| عرض نطاق ذاكرة RTX 5090 | سرعة نقل البيانات حوالي 1800 جيجابايت/ثانية لكل بطاقة |
| vLLM — Qwen3-235B Q4_K_M على 4x RTX 5090 (مفردة) | ~90 توك/ثانية |
| vLLM — Qwen3-235B Q4_K_M على 4x RTX 5090 (الدفعة 32) | إجمالي حوالي 450 توكو/ثانية |
| SGLang — DeepSeek V3 Q2 على 8x Blackwell (مفرد) | ~28 توك/ثانية |
| llama.cpp — Kimi-K2 UD-TQ1_0 على 8x Blackwell 256 GB | ~7-10 توكوفيرول/ثانية |
ستقوم شركة Kentino بنشر رموز تعريفية خاصة بها بعد إصدار أول نسخة للعميل مع رمز Turin النهائي.
ليست مثالية لـ
- عمليات النشر التي تراعي الميزانية (الخيار المميز في تورينو مقابل بدائل جنوة أو روما)
- أحمال عمل كثيفة أحادية المستأجر 70 مليار (مبالغة - 4x RTX 5090 أو 4x RTX Pro 6000 هي الفئة المناسبة)
- Frontier 600B+ في الربع الرابع+ السياق الكامل (يتطلب مساحة تخزين 576 جيجابايت+ - انظر 6x RTX Pro 6000)
- التدريب المستمر من الصفر (لا يوجد NVLink على بطاقة RTX 5090 المخصصة للمستهلكين)
الضمان ومدة التسليم
تشمل عملية التجميع، وتكوين نظام الإدخال والإخراج الأساسي (BIOS)، وتثبيت برامج التشغيل، واختبار التشغيل الأولي، والتحقق من الوظائف. يعتمد وقت التسليم على توافر المكونات، ويتم تأكيده عند الطلب.
الإضافات الموصى بها
- قم بتوسيع ذاكرة الوصول العشوائي (RAM) إلى 1.5 تيرابايت من نوع DDR5 (24 × 64 جيجابايت سعة كاملة) - وهو أمر ضروري لتشغيل Kimi-K2 Q4 أو DeepSeek V3 Q3 دون تجاوز سعة ذاكرة الوصول العشوائي.
- NVIDIA ConnectX-5 100 GbE MCX555A-ECAT — شبكة الجيل الخامس لعُقد المجموعة
- Mellanox ConnectX-6 25 GbE SFP28 لبنية مركز البيانات
- 4 تيرابايت NVMe Gen4 x4 للإقلاع + مكتبة النماذج
- خزانة رف كاملة بحجم 24U مع وحدة توزيع طاقة مُدارة
- وحدة تزويد الطاقة غير المنقطعة عبر الإنترنت 8-10 كيلو فولت أمبير (حرجة - ذروة السحب 5.5 كيلو واط)
مشاركة
