مدل هوش مصنوعی DeepSeek اخیراً توجه گستردهای را در میان متخصصان این حوزه به خود جلب کرده است. برخی ادعا میکنند که این مدل میتواند مصرف انرژی در سیستمهای هوش مصنوعی را کاهش دهد، اما بررسیهای جدید نشان میدهند که این ادعا چندان هم دقیق نیست و ممکن است تصویر نادرستی از کارایی این مدل ارائه شود.
دیپسیک و روش جدید آموزش مدلهای هوش مصنوعی
براساس گزارش MIT Technology Review، تمامی مدلهای هوش مصنوعی دو مرحله آموزش (Training) و استنتاج (Inference) را طی میکنند که هر دو نیازمند پردازشهای سنگین و مصرف بالای انرژی هستند. DeepSeek در مرحله آموزش از الگوریتم «ترکیب متخصصان» (Mixture of Experts) بهره میبرد که تنها بخشی از پارامترهای مدل را فعال میکند. این رویکرد کمک میکند که مصرف انرژی در فاز آموزش کاهش یابد.
علاوه بر این، دیپسیک از یادگیری تقویتی (Reinforcement Learning) به شکل پیشرفتهای استفاده میکند که باعث میشود مدل بتواند بدون نیاز به مداخله انسانی بهینهسازی شود.
زنجیره تفکر؛ عامل افزایش مصرف انرژی در دیپسیک
دیپسیک در مرحله استنتاج از تکنیکی به نام «زنجیره تفکر» (Chain of Thought) استفاده میکند. این روش به مدل کمک میکند سوالات را مرحلهبهمرحله و بهصورت منطقی پردازش کند، که باعث افزایش دقت در حل مسائل پیچیده مانند ریاضیات، منطق و مباحث اخلاقی میشود.
اما چالش اصلی اینجاست؛ به دلیل پیچیدگیهای اضافی این فرآیند، دیپسیک انرژی بیشتری نسبت به مدلهای هوش مصنوعی مشابه مصرف میکند.

مصرف بالای انرژی؛ تهدیدی برای آینده هوش مصنوعی؟
بررسیهای انجامشده نشان میدهد که دیپسیک برای تولید پاسخهای خود ۴۱ درصد بیشتر از مدلهای مشابه متا انرژی مصرف میکند. همچنین در ۴۰ آزمایش مستقل مشخص شد که این مدل، به دلیل ارائه پاسخهای طولانیتر، ۸۷ درصد انرژی بیشتری نسبت به استانداردهای فعلی متا نیاز دارد.
این موضوع نگرانیهایی را در میان کارشناسان برانگیخته است. ساشا لوچیونی، پژوهشگر هوش مصنوعی در Hugging Face، هشدار داده که اگر استفاده از روش زنجیره تفکر در مدلهای مختلف هوش مصنوعی گسترش یابد، مصرف انرژی بهشدت افزایش خواهد یافت و تمام تلاشها برای کاهش مصرف انرژی در این حوزه بیاثر میشود.
دیپسیک؛ راهکار یا بحران؟
اگرچه DeepSeek در مرحله آموزش مصرف انرژی را بهینه کرده است، اما در مرحله استنتاج، به دلیل پردازشهای پیچیدهتر، مصرف انرژی بالاتری دارد. این موضوع باعث شده که برخی کارشناسان نسبت به مقرونبهصرفه بودن این مدل برای شرکتها تردید داشته باشند.
در گزارش MIT آمده است که به دلیل عدم دسترسی به مدل OpenAI o1، مقایسهها روی مدلهای مشابه متا انجام شده است. حال سوال اینجاست که آیا پیشرفت در دقت و توانایی پردازش منطقی ارزش این هزینه سنگین را دارد؟ یا باید به دنبال راهحلهایی بود که کارایی را افزایش دهد، اما مصرف انرژی را کنترل کند؟
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: technologyreview.com
ثبت نظر