در دنیای فناوری، زمانی که غولهایی مثل گوگل، متا و مایکروسافت به دنبال شتابدهندههای قدرتمند برای تقویت مدلهای هوش مصنوعی خود هستند، هرگونه نقص در عرضه محصولات میتواند تأثیری جدی بر برنامههای آنها داشته باشد.
اکنون، انویدیا با مشکلی در پردازندههای پیشرفته Blackwellمواجه شده که مستقیماً به عملکرد و زمانبندی این شرکتها مرتبط است.
مشکل اصلی؛ گرمای بیش از حد در رکهای سرور
پردازندههای Blackwell که به عنوان یکی از قویترین شتابدهندههای هوش مصنوعی طراحی شدهاند، به دلیل تولید گرمای بیش از حد در رکهای سرور، توجهها را به خود جلب کردهاند. بر اساس گزارشها، سرورهایی که دارای ۷۲ واحد از این پردازندهها هستند و مصرف برقی حدود ۱۲۰ کیلووات دارند، با چالشهای حرارتی شدیدی روبهرو شدهاند. این موضوع نه تنها باعث کاهش عملکرد پردازندهها شده، بلکه خطر آسیب جدی به قطعات سختافزاری را نیز افزایش داده است.
انویدیا برای حل این مشکل مجبور به بازنگری و طراحی مجدد رکهای سرور شده است. اما این تغییرات باعث شده روند تحویل پردازندههای Blackwell به مشتریان به تأخیر بیفتد. این تأخیر نگرانیهای جدی برای شرکتهای بزرگی مانند گوگل و متا ایجاد کرده است که به این پردازندهها برای پروژههای حیاتی هوش مصنوعی خود وابستهاند.
شکلات پیشین در طراحی اولیه Blackwell
این اولین باری نیست که پردازندههای Blackwell با چالش روبهرو میشوند. پیش از این، نقص در طراحی اولیه این پردازندهها باعث تأخیر در تولید آنها شده بود. پردازندههای Blackwell از فناوری پیشرفته CoWoS-Lشرکت TSMC بهره میبرند، اما عدم هماهنگی حرارتی در اجزای آنها مشکلاتی مانند تاب برداشتن و خرابی قطعات را ایجاد کرده بود. انویدیا با اصلاحات گسترده در لایههای سیلیکونی و فتوماسکها، این مشکلات را حل کرد و تولید انبوه را از اواخر اکتبر آغاز نمود. با این حال، مسئله حرارت همچنان چالشی بزرگ باقی مانده است.
تأثیر بر غولهای فناوری و آینده انویدیا
گوگل، متا و مایکروسافت از این پردازندهها برای آموزش مدلهای زبانی بزرگ (LLM) خود استفاده میکنند. تأخیر در عرضه این شتابدهندهها ممکن است برنامههای توسعهای آنها را مختل کند. این چالشها نشان میدهد که حتی بزرگترین بازیگران صنعت فناوری نیز نمیتوانند از مشکلات فنی و پیچیدگیهای تولید محصولات پیشرفته در امان باشند.
آیا انویدیا از این بحران عبور خواهد کرد؟
انویدیا اعلام کرده است که با همکاری نزدیک با تأمینکنندگان و مشتریان، به دنبال حل سریع این مشکلات است. این شرکت قول داده تغییرات لازم را برای رفع مشکلات حرارتی اعمال کند و زمان تحویل پردازندهها را به حداقل برساند. با این حال، باید دید آیا انویدیا قادر خواهد بود اعتماد مشتریان خود را حفظ کرده و این بحران را پشت سر بگذارد یا نه.
چالشهایی که پردازندههای Blackwell با آنها مواجه شدهاند، نشاندهنده حساسیت بالای محصولات در عصر هوش مصنوعی است. شرکتهایی مانند انویدیا که در قلب این انقلاب فناوری قرار دارند، باید آماده مقابله با چالشهای فنی پیچیده و ارائه راهحلهای نوآورانه برای رفع آنها باشند. آیا Blackwell میتواند به وعدههای خود عمل کند و نقش خود را در آینده هوش مصنوعی ایفا نماید؟ زمان پاسخ این سؤال را مشخص خواهد کرد.
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: tomshardware.com
ثبت نظر