تخطي إلى معلومات المنتج
1 of 7

Kentino المحدودة

K-AI 288 Rome L40 — 6× NVIDIA L40 Passive Enterprise (288 GB ECC VRAM)

K-AI 288 Rome L40 — 6× NVIDIA L40 Passive Enterprise (288 GB ECC VRAM)

سعر عادي EUR € 59.490,00
سعر عادي سعر البيع EUR € 59.490,00
تخفيضات نفذت الكمية
شامل الضريبة الشحن يتم احتساب الشحن عند متابعة عملية الشراء.

K-AI 288 Rome L40 2172TOPS

خادم مؤسسي بسعة 288 جيجابايت من ذاكرة الوصول العشوائي للفيديو ECC
6x NVIDIA L40 Passive | EPYC Milan | 2172 TOPS INT8

2 172
أفضل 8
288 جيجا بايت
مجموعة ذاكرة الفيديو ECC
ECC
النهائي إلى نهاية
24/7
إنتاج مصنف

المراجع الخارجية المنشورة. لم يتم القياس على أجهزة كينتينو.

خادم استدلال مؤسسي يُثبّت في رفّ بحجم 4U، مزوّد بستّ بطاقات بيانات سلبية من نوع NVIDIA L40 Ada Lovelace (سعة كلّ منها 48 جيجابايت ECC) مُجمّعة في ذاكرة وصول عشوائي للفيديو (VRAM) بسعة 288 جيجابايت ECC، ومعالج AMD EPYC 7643 Milan (48 نواة/96 خيطًا)، وذاكرة DDR4-2666 بسعة 384 جيجابايت ECC، ووحدة تخزين NVMe بسعة 2 تيرابايت للتشغيل، ووحدتي تزويد طاقة ATX متزامنتين بقدرة 2.5 كيلوواط. يُوفّر هذا الخادم تقنية ECC شاملة، وهو مُصمّم خصيصًا للعمل على مدار الساعة طوال أيام الأسبوع في بيئات الإنتاج المؤسسية التي تُولي أهمية قصوى لسلامة البيانات على مستوى البتّات ونطاقات الأعطال القابلة للصيانة.

أجهزة التبخير

مكون التفاصيل
وحدات معالجة الرسومات 6x NVIDIA L40 48 GB ECC (Ada Lovelace، مركز بيانات سلبي، 300 واط، PCIe 4.0 x16، فتحة مزدوجة، 362 INT8 TOPS/بطاقة)
مجموعة ذاكرة الوصول العشوائي للفيديو 288 جيجابايت إجمالي ECC عبر 6 بطاقات (لا يوجد NVLink على L40 PCIe SKU)
وحدة المعالجة المركزية‏: AMD EPYC 7643 Milan (48 نواة/96 خيط، 225 واط، 128 مسار PCIe 4.0)
اللوحة الأم ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI)
ذاكرة الوصول العشوائي للنظام 384 جيجابايت DDR4-2666 ECC RDIMM (6 × 64 جيجابايت - فتحتان DIMM متاحتان للترقية إلى 512 جيجابايت)
صندوق الأمتعة / التخزين 2 تيرابايت NVMe M.2 (PCIe 4.0 x4)
مزود الطاقة 2x 2.5 كيلو واط ATX مع كابل مزامنة مزدوج لوحدة تزويد الطاقة (5 كيلو واط إجمالي)
الهيكل وحدة تثبيت على رف 4U (تصميم بستة فتحات)
تبريد مبرد برج SP3 (فئة Arctic Freezer 4U-M) + تدفق هواء موجه من الأمام إلى الخلف (مراوح صناعية)
الانرنيت منفذان مدمجان بسرعة 10 جيجابت إيثرنت (إنتل X550)

مغلف الطاقة

  • استهلاك وحدة معالجة الرسومات: 6 × 300 واط = 4600 واط
  • إجمالي استهلاك الطاقة للنظام تحت الحمل الكامل: ~2175 واط
  • إجمالي قدرة وحدة تزويد الطاقة: 5000 واط (وحدتان متزامنتان بقدرة 2.5 كيلو واط) - هامش أمان بنسبة 56.5%
  • مزود طاقة مزدوج لتوزيع الطاقة بشكل منفصل - تعطل مزود طاقة واحد = فقدان وحدتي معالجة رسومية أو وحدتي معالجة رسومية بالإضافة إلى اللوحة الأم

طوبولوجيا المسار

توفر لوحة ROMED8-2T سبعة منافذ PCIe 4.0 x16 مباشرة من معالج EPYC Milan. ستة منافذ مزودة بوصلات Gen4 x16 سلبية، ومنفذ واحد فارغ لبطاقة الشبكة/التخزين. لا حاجة إلى محول PCIe. وصلة L40 الأصلية هي PCIe 4.0 x16، مما يضمن عدم فقدان عرض النطاق الترددي. لا يوجد NVLink؛ حركة البيانات بين وحدات معالجة الرسومات تتم عبر PCIe نظير إلى نظير.

ما يمكنك تشغيله

بفضل ذاكرة فيديو ECC مجمعة بسعة 288 جيجابايت موزعة على 6 بطاقات L40 سلبية، يدعم هذا الخادم معالجة نماذج LLM مفتوحة الوزن من Frontier بسرعة Q4، وخدمة متزامنة متعددة النماذج، وخطوط أنابيب الفيديو/الوسائط، واستدلال إنتاجي مؤسسي على مدار الساعة. ملاحظة: L40 هي Ada Lovelace وليست Blackwell - يتم تحويل fp8 إلى bf16. استخدم GGUF Q4/Q5 أو AWQ/GPTQ int4 لتحقيق أقصى كفاءة لذاكرة الفيديو.

ماجستير في القانون - نص / استدلال / برمجة

الحدود الصينية

  • Qwen3-235B-A22B الربع الرابع (~132 جيجابايت) مع سياق طويل جدًا + ميزانية KV سخية (~15-20 توكا/ثانية مرجع واحد منشور)
  • GLM-4.5 / 4.6 / 4.7 الربع الرابع (~177 جيجابايت) مريح على 6-way TP (~12-18 توكو/ثانية مفردة، مرجع منشور)
  • هونيوان-كبير 389B/52B الربع الثالث (~160 جيجابايت)؛ ERNIE-4.5-424B-A47B الربع الرابع (~180 جيجابايت)
  • Qwen3-Coder-480B-A35B وكيل الترميز الرئيسي للربع الثاني (~160 جيجابايت)
  • MiniMax-M1 / Text-01 الربع الثالث (~180 جيجابايت) 1 ميجابايت - تنبيه Lightning
  • Qwen3-30B-A3B / QwQ-32B / Qwen3-32B — بطاقة واحدة مع 6 مسارات متوازية
  • ديب سيك-R2 32B MoE متفرق - بطاقة واحدة لكل تدفق، 6 جلسات متزامنة

الحدود الغربية

  • اللاما 3.3 70 ب bf16 (~142 جيجابايت) خدمة متعددة المستأجرين (~17 تيكو/ثانية، مرجع منشور)، أو Q4 (~43 جيجابايت) مع 6 نسخ متزامنة
  • لاما 4 كشاف 109B/17B bf16 (~218 جيجابايت مضغوطة) أو Q4 (~63 جيجابايت) مريحة
  • ميسترال صغير 3 / ماجيسترال / ديفسترال صغير (24B) bf16 (~40-50 tok/s single, published reference)
  • بيسترال كبير / ميسترال كبير 2 الربع السادس - الربع الثامن (حوالي 90-140 جيجابايت)
  • لاما-3.1-نيموترون ألترا 253B الربع الرابع (~119 جيجابايت)
  • gpt-oss-120b MXFP4 (~80 جيجابايت عبر GGUF على Ada - لاحظ تحذير Ada بشأن التحديث)
  • أمر التماسك R+ 104B Q4 RAG stack

نماذج الرؤية واللغة

Qwen3-VL-235B-A22B Q4؛ Qwen3-VL-32B؛ InternVL3.5-78B / 241B-A28B Q4 (~135 جيجابايت)؛ Llama 3.2 90B Vision bf16 (~180 جيجابايت)؛ Pixtral 12B؛ Molmo 72B؛ Gemma 3 12B/27B متعدد الوسائط؛ GLM-4.6V كامل (106B bf16)؛ MiniCPM-o 2.6. يُعدّ NVENC/NVDEC الخاص بـ L40 مفيدًا بشكل خاص لخطوط أنابيب VLM عالية الإنتاجية للمستندات/الفيديو.

توليد الصور

FLUX.1 [dev] / Kontext / Tools عبر عدة عمال في وقت واحد (~3.5 ثانية لكل صورة 1024x1024 على L40 fp8 واحد، مرجع منشور) — مزرعة عمال ComfyUI 6x ممكنة؛ SD 3.5 كبير؛ HunyuanImage-2.1 (17B) bf16؛ HunyuanDiT؛ Kolors 2.0؛ AuraFlow؛ OmniGen.

توليد الفيديو

Wan 2.2 T2V-A14B / I2V-A14B ثنائي الخبير bf16 (~54 جيجابايت، ~20-30 ثانية لكل مقطع فيديو مدته 4 ثوانٍ بدقة 720 بكسل، مرجع منشور)؛ HunyuanVideo 13B bf16 كلا الخبيرين؛ Open-Sora 2.0 bf16؛ CogVideoX-5B؛ Mochi-1؛ LTX-Video؛ Pyramid Flow؛ NVIDIA Cosmos Predict 2. تتولى أجهزة NVENC/NVDEC الخاصة بـ L40 معالجة الترجمة/التحرير/إعادة الترميز على نطاق واسع بالتزامن مع الإنتاج.

الصوت / الكلام / تحويل النص إلى كلام

  • ASR: Whisper v3 كبير / توربو؛ Parakeet-TDT 1.1B؛ Canary 1B؛ Qwen3-ASR؛ SenseVoice
  • تحويل النص إلى كلام: CosyVoice 2/3؛ Kokoro 82M؛ Stable Audio Open؛ XTTS v2؛ Step-Audio-EditX
  • في الوقت الحقيقي / من جهاز لآخر: كيوتاي موشي؛ خطوة الصوت 2 ميني / R1؛ Qwen2.5-أومني-7B

خدمة متعددة النماذج / متعددة المستأجرين

  • إقامة متعددة النماذج — Qwen3-235B Q4 + FLUX.1 + HunyuanVideo + Whisper-turbo + Moshi + embedder، جميعها مقيمة
  • ستة أحمال عمل متزامنة من فئة 48 جيجابايت (حمل واحد لكل بطاقة): 6x Qwen3-VL-32B، أو 6x FLUX.1، أو 6x ASR streams
  • نموذج متوازي للموترات سداسي الاتجاهات لميزانية وزارة التعليم التي تتجاوز 200 مليار دولار في الربع الرابع مع سياق واقعي
  • خطوط أنابيب RAG — الأمر R+ / Qwen3 + إعادة الترتيب + التضمين + تحليل الصور على نفس المضيف

أحمال العمل المستهدفة

  • نظام استدلال LLM للإنتاج يعمل على مدار الساعة طوال أيام الأسبوع - أكثر من 100 مستخدم متزامن على ميزانية تزيد عن 200 مليار دولار أمريكي في الربع الرابع، محمي بتقنية ECC
  • خط أنابيب الذكاء الاصطناعي للوسائط على نطاق المؤسسات - إضافة التعليقات + الإشراف + الصور المصغرة + إعادة الترميز على 6 مسارات متوازية عبر NVENC/NVDEC
  • برمجيات كخدمة متعددة المستأجرين حيث يكون عزل كل مستأجر عبر البطاقات المادية أمرًا بالغ الأهمية
  • واجهة خلفية RAG مع قارئ Command R+ + مُعيد ترتيب + مُضمّن + رؤية مقيمة بالكامل
  • زوج من الخوادم يُعطي الأولوية للموثوقية، ليحل محل نظام L40 Legacy المكون من 12 خادمًا - خادمان K-AI 288 = سعة إجمالية 576 جيجابايت مع نطاقات أعطال مستقلة

المراجع المنشورة للأداء

مراجع خارجية | لم يتم القياس على أجهزة كينتينو

مؤشر نتيجة
L40 لكل بطاقة INT8 TOPS 362 TOPS
عرض نطاق الذاكرة L40 864 جيجابايت/ثانية لكل بطاقة
vLLM — Llama 3.3 70B AWQ INT4 على 2x L40 TP (مفرد) ~25-35 توكوفيرول/ثانية
vLLM — Llama 3.3 70B AWQ INT4 على 2x L40 TP (الدفعة-16) إجمالي يتراوح بين 150 و200 توكو/ثانية
llama.cpp — GLM-4.6 Q4 على 6x L40 (مفرد) ~12-18 توكوفيرول/ثانية
FLUX.1 [dev] على L40 fp8 واحد حوالي 3.5 ثانية لكل صورة بحجم 1024×1024

ستقوم شركة كينتينو بنشر الأرقام الخاصة بها بعد إصدار النسخة التجريبية الأولية للعملاء.

ليست مثالية لـ

  • الاستدلال الأصلي بتقنية fp8 بأقصى سرعة — تحويلات Ada إلى bf16؛ استخدم GGUF Q4/Q5 أو AWQ/GPTQ int4 بدلاً من ذلك. للاطلاع على الاستدلال الأصلي بتقنية fp8، راجع K-AI 384 Rome RTXPro6000 (Blackwell).
  • تدريب نماذج كبيرة من الصفر (بدون NVLink)
  • الاستدلال أحادي المستخدم ذو الميزانية المحدودة - 4x L4 أو 4x 5080 أرخص بكثير لأحمال العمل الصغيرة
  • Frontier 600B+ كثيف في الربع الرابع وما بعده (يتطلب مساحة تخزين 576 جيجابايت أو أكثر - انظر 6x RTX Pro 6000)

الضمان ومدة التسليم

3 سنة
ضمان وحدة معالجة الرسومات الأصلية من NVIDIA
2 سنة
ضمان قطع الغيار
عام واحد
ضمان العمل
10-28 أيام
المهلة

تشمل عملية التجميع، وتكوين نظام الإدخال والإخراج الأساسي (BIOS)، وتثبيت برامج التشغيل، واختبار الأداء، واختبار الذاكرة، والتحقق من الوظائف. يعتمد وقت التسليم على توافر المكونات، ويتم تأكيده عند الطلب.

الإضافات الموصى بها

  • قم بترقية ذاكرة الوصول العشوائي إلى 512 جيجابايت من نوع DDR4 (أضف 2 × 64 جيجابايت - فتحتان DIMM متاحتان) للحصول على ميزانية KV أكبر
  • 4 تيرابايت NVMe Gen4 x4 لتخزين مكتبة النماذج
  • خزانة رف كاملة بحجم 24U مع وحدة توزيع طاقة مُدارة + وحدة تزويد طاقة غير منقطعة متصلة بالإنترنت (أمر بالغ الأهمية لأحمال عمل تصحيح الأخطاء على مدار الساعة طوال أيام الأسبوع)
  • وحدة K-AI 288 ثانية مزدوجة - تحل محل غلاف L40 Legacy المكون من 12 وحدة مع نطاقين مستقلين للفشل
عرض التفاصيل الكاملة