ويكي البناء

ويكي البناء

سلسلة مرجعية حول بناء وربط وتشغيل وتزويد الحوسبة بالذكاء الاصطناعي - للمشترين والمكاملين الذين يحددون حجم صندوق 4-GPU التالي أو خادم 8-GPU أو مختبر الروبوتات.

جميع المقالات مستوحاة من تجارب حقيقية مع سيارات كينتينو. لا حشو ولا إطالة. آراء صريحة حيثما تقتضي الهندسة ذلك. شفافية تامة بشأن الحدود.

20مقالات لـ 9مسارات المواضيع 2جديد أسبوعياً · الثلاثاء + الخميس

خادم الذكاء الاصطناعي الأساسي سلسلة دبليو

إذا كنت بصدد تحديد مواصفات جهاز كمبيوتر متعدد وحدات معالجة الرسومات، فاقرأ هذه المعلومات أولاً: الذاكرة، و PCIe، والطاقة، وقائمة مختصرة لوحدات معالجة الرسومات.

W01ذاكرة الوصول العشوائي (RAM) وذاكرة الوصول العشوائي للفيديو (VRAM): كيف ترتبطان في خادم الذكاء الاصطناعيجهاز مزود بأربع وحدات معالجة رسومية وذاكرة فيديو بسعة 192 جيجابايت وذاكرة وصول عشوائي بسعة 32 جيجابايت معطل. النسبة الصحيحة تعتمد على البرامج التي تشغلها فعلياً.
W02مسارات PCIe وطوبولوجيا خادم الذكاء الاصطناعي متعدد وحدات معالجة الرسوماتإن عبارة "PCIe x8 مقابل x16 لا يهم للاستدلال" صحيحة في الغالب - والأشخاص الذين يكررونها عادة لا يعرفون السبب.
W03رافعات وحدة معالجة الرسومات: متى تحتاج إليها وما الذي يتعطل؟حيث تموت سلامة الإشارة بهدوء، وتعيد الروابط تدريبها بصمت إلى الجيل الثالث، وتبدأ الاختبارات التي تجتاز الاختبارات في إسقاط وحدة معالجة رسومية واحدة يوميًا.
W04تحديد حجم وحدة تزويد الطاقة وتكوينات وحدة تزويد الطاقة المزدوجةالرياضيات، وواقع الشكل، والإطار الصادق لتوصيل الطاقة لوحدات معالجة الرسومات 4 و 8.
W07خيارات وحدة معالجة الرسومات: 5090، 4090، RTX Pro 6000، L40، L4مقارنة صريحة ومباشرة مع أرقام الأداء الحقيقية، والمفاضلات، وتدفق اتخاذ القرار الذي نستخدمه بالفعل في مكالمات العملاء.

الشبكات سلسلة N.

واقع NVLink، وطوبولوجيات المجموعات (الورقة العمودية، والشجرة السمينة، واليعسوب، وبدون مفتاح)، وتحليل زمن الوصول، والتوجيه، وإعداد RDMA عمليًا.

N03NVLink و NVSwitch: متى يكون الأمر مهمًاتتباهى شركة DGX في حملاتها التسويقية بعرض نطاق ترددي NVLink يصل إلى تيرابايت في الثانية. لكن بالنسبة لمعظم أحمال عمل Kentino، لن تحتاج إلى أيٍّ من ذلك.
N04الطوبولوجيات المُبدَّلة: شجرة سميكة، عمود ورقي، يعسوب، مكعب رباعي الأبعادتبدأ جميع مخططات المجموعات بنفس الطريقة. الخيار الحقيقي هو نوع البنية، ومقدار الاكتظاظ، وسرعة كل منفذ.
N05بنى الشبكات اللاسلكية: الشبكة المتداخلة، والحلقية، والاتصال المباشرسيتوفر محول 400 جيجابت إيثرنت ذو 32 منفذًا بسعر يتراوح بين 40 ألف و80 ألف يورو في منتصف عام 2026. بالنسبة لعقدتين إلى أربع عقد، لست بحاجة إلى واحد.
N06تحليل زمن الاستجابة: أين تذهب كل ميكروثانية؟يقوم المستخدمون بتقييم الشبكات باستخدام مخططات عرض النطاق الترددي. ثم تُظهر نتائج اختبار allreduce رقمًا لا يقترب بأي حال من الأحوال من سرعة الخط.
N07التوجيه: ECMP، التوجيه التكيفي، DCQCNما يحدث فوق الكابلات وبطاقات الشبكة والمحولات: كيف تجد الحزم مسارًا، وما الذي يمنع البنية التحتية من الانهيار في ظل تقليل الكل.
N08إعداد RDMA عمليًا + تصميم وصلة الإرسال العنقوديةالعمل العملي: تثبيت برامج التشغيل، وإثبات المسار، وتشغيل GPUDirect، والتحقق من صحة NCCL، ثم الانتقال إلى تصميم وصلة الرفع للمجموعة بأكملها.

التكتل سلسلة K

عندما لا تكفي عقدة واحدة. اتخاذ القرار باستخدام عقدة واحدة مقابل عدة عقد، والتدريب الموزع، ومجموعات الاستدلال، والتخزين المشترك.

كيه01 مقارنة بين نظام أحادي العقدة متعدد وحدات معالجة الرسومات ونظام متعدد العقد: متى يتم التوسع الأفقيإن الخطأ الأكثر تكلفة هو تقسيم ميزانية وحدة معالجة الرسومات على عقدتين بينما كان من الممكن أن تفي عقدة واحدة أكبر بالغرض.
كيه02 التدريب الموزع في عام 2026: DDP، FSDP2، DeepSpeed، Megatronأربع مجموعات مفتوحة المصدر، وخمسة محاور للتوازي، وأي منها يجب اختياره فعلاً لأي مهمة.
كيه03 مجموعات الاستدلال: vLLM Tensor Parallel، Pipeline Parallelلا يتناسب نموذج 70B مع وحدة معالجة رسومية واحدة مع ذاكرة تخزين مؤقتة KV فعّالة. ولا يتناسب نموذج 405B مع عقدة واحدة. وتحدد طريقة تقسيم النموذج تكلفته.
كيه04 التخزين العنقودي: NFS، BeeGFS، Lustre، مخازن الكائناتالتخزين المشترك هو جزء من مجموعة موزعة لا يفكر فيه أحد حتى تصل نسبة استخدام وحدات معالجة الرسومات (GPUs) له إلى 40%.

الاندماج سلسلة I

وضع كل شيء معًا - بنية الروبوت بالإضافة إلى الخادم التي تربط السلسلة بأكملها بالأجهزة الحقيقية.

I01بنية الذكاء الاصطناعي الطرفي: الروبوت ↔ خادم الاستدلال المحليالمقال الأمثل. الروبوت البشري الذي اشتريته ليس سوى نصف النظام؛ هذا هو النصف الآخر وكيفية ربط النصفين معًا.

الروبوتات سلسلة R · مدونة

الروبوت البشري الحديث هو مزيج من ستة أو سبعة تخصصات هندسية. يشمل ذلك عملية الشراء، وسبب حاجة الروبوتات إلى حوسبة طرفية مخصصة، ومجموعة نماذج العالم المتطورة التي تعتمد على تقنية VLM.

RX450شراء روبوت: أوقات التسليم، والجمارك، والدعمشراء معدات الروبوتات إلى الاتحاد الأوروبي ليس كشراء محطة عمل. إليك ما تبدو عليه فترات التسليم والجمارك وخدمات ما بعد البيع على أرض الواقع.
RX450لماذا تحتاج الروبوتات إلى حوسبة طرفية مخصصةحجة زمن الاستجابة. لماذا يؤدي وضع نموذجك خلف واجهة برمجة تطبيقات سحابية إلى تعطيل حالة الاستخدام التي يريدها العميل فعليًا.
RX450التصنيف التلقائي باستخدام نماذج العالم المدفوعة بتقنية VLMمجموعة تقنيات الإدراك المتطورة - Qwen2.5-VL، و Grounded-SAM 2، و Florence-2، و NVIDIA Cosmos - المطبقة على الحقيقة الأرضية للروبوتات.

دراسات الحالة سلسلة C · مدونة

تعتمد شركة Real Kentino على أرقام حقيقية ومقاسة. صور، وقوائم مكونات، ومعايير، وتقارير ما بعد التنفيذ صادقة.

C01دراسة حالة: محطة عمل الذكاء الاصطناعي بأربع بطاقات RTX 4090معالج EPYC 7542، ذاكرة وصول عشوائي DDR4 ECC سعة 512 جيجابايت، أربع بطاقات رسومات RTX 4090. تم قياس أداء 651.6 تيرافلوب. معدل نقل بيانات مستدام 179.3 توك/ثانية على vLLM. درجة حرارة قصوى 73 درجة مئوية. هذه أرقام حقيقية من جهاز تم شحنه.

مقالات جديدة كل ثلاثاء وخميس

هذه الويكي مكتبة متنامية، حيث تُنشر مقالات جديدة حول البناء والشبكات والتجميع والطاقة والروبوتات حتى عام 2026، وكلها مستمدة من مشروع بناء حقيقي في كينتينو. إذا كنت ترغب في إعطاء الأولوية لموضوع معين، فاكتب إلى info@kentino.com.