دیپ‌سیک؛ نوآوری در هوش مصنوعی یا تهدیدی برای مصرف انرژی؟

deepseek opdkfvfd

مدل هوش مصنوعی DeepSeek اخیراً توجه گسترده‌ای را در میان متخصصان این حوزه به خود جلب کرده است. برخی ادعا می‌کنند که این مدل می‌تواند مصرف انرژی در سیستم‌های هوش مصنوعی را کاهش دهد، اما بررسی‌های جدید نشان می‌دهند که این ادعا چندان هم دقیق نیست و ممکن است تصویر نادرستی از کارایی این مدل ارائه شود.

دیپ‌سیک و روش جدید آموزش مدل‌های هوش مصنوعی

براساس گزارش MIT Technology Review، تمامی مدل‌های هوش مصنوعی دو مرحله آموزش (Training) و استنتاج (Inference) را طی می‌کنند که هر دو نیازمند پردازش‌های سنگین و مصرف بالای انرژی هستند. DeepSeek در مرحله آموزش از الگوریتم «ترکیب متخصصان» (Mixture of Experts) بهره می‌برد که تنها بخشی از پارامترهای مدل را فعال می‌کند. این رویکرد کمک می‌کند که مصرف انرژی در فاز آموزش کاهش یابد.

علاوه بر این، دیپ‌سیک از یادگیری تقویتی (Reinforcement Learning) به شکل پیشرفته‌ای استفاده می‌کند که باعث می‌شود مدل بتواند بدون نیاز به مداخله انسانی بهینه‌سازی شود.

زنجیره تفکر؛ عامل افزایش مصرف انرژی در دیپ‌سیک

دیپ‌سیک در مرحله استنتاج از تکنیکی به نام «زنجیره تفکر» (Chain of Thought) استفاده می‌کند. این روش به مدل کمک می‌کند سوالات را مرحله‌به‌مرحله و به‌صورت منطقی پردازش کند، که باعث افزایش دقت در حل مسائل پیچیده مانند ریاضیات، منطق و مباحث اخلاقی می‌شود.

اما چالش اصلی اینجاست؛ به دلیل پیچیدگی‌های اضافی این فرآیند، دیپ‌سیک انرژی بیشتری نسبت به مدل‌های هوش مصنوعی مشابه مصرف می‌کند.

 

1738017918969-1024x576.jpg
-

مصرف بالای انرژی؛ تهدیدی برای آینده هوش مصنوعی؟

بررسی‌های انجام‌شده نشان می‌دهد که دیپ‌سیک برای تولید پاسخ‌های خود ۴۱ درصد بیشتر از مدل‌های مشابه متا انرژی مصرف می‌کند. همچنین در ۴۰ آزمایش مستقل مشخص شد که این مدل، به دلیل ارائه پاسخ‌های طولانی‌تر، ۸۷ درصد انرژی بیشتری نسبت به استانداردهای فعلی متا نیاز دارد.

این موضوع نگرانی‌هایی را در میان کارشناسان برانگیخته است. ساشا لوچیونی، پژوهشگر هوش مصنوعی در Hugging Face، هشدار داده که اگر استفاده از روش زنجیره تفکر در مدل‌های مختلف هوش مصنوعی گسترش یابد، مصرف انرژی به‌شدت افزایش خواهد یافت و تمام تلاش‌ها برای کاهش مصرف انرژی در این حوزه بی‌اثر می‌شود.

دیپ‌سیک؛ راهکار یا بحران؟

اگرچه DeepSeek در مرحله آموزش مصرف انرژی را بهینه کرده است، اما در مرحله استنتاج، به دلیل پردازش‌های پیچیده‌تر، مصرف انرژی بالاتری دارد. این موضوع باعث شده که برخی کارشناسان نسبت به مقرون‌به‌صرفه بودن این مدل برای شرکت‌ها تردید داشته باشند.

در گزارش MIT آمده است که به دلیل عدم دسترسی به مدل OpenAI o1، مقایسه‌ها روی مدل‌های مشابه متا انجام شده است. حال سوال اینجاست که آیا پیشرفت در دقت و توانایی پردازش منطقی ارزش این هزینه سنگین را دارد؟ یا باید به دنبال راه‌حل‌هایی بود که کارایی را افزایش دهد، اما مصرف انرژی را کنترل کند؟

 

 

اگر علاقه‌مند دنیای تکنولوژی هستید حتما شبکه‌های اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.

منبع خبر: technologyreview.com

84yl1DIhDZwupRXl2It_V

مریم محمودی - کارشناس تولید محتوا

سلام من مریم هستم علاقه‌مند به حوزه تکنولوژی و فعال در زمینه تولید محتوا متنی؛ هر روز ساعت زیادی رو صرف نوشتن و ویراستاری می‌کنم و خوشحال میشم که نظرتون رو با من در میون بزارید.


0 نظر درباره‌ی این پست نوشته شده است.

ثبت نظر