دیپسیک، استارتاپی که در مدت کوتاهی توجه بسیاری را به خود جلب کرده، حالا با صرف ۱.۶ میلیارد دلار و بهرهگیری از ۵۰ هزار تراشه انویدیا، زیرساختهای قدرتمند خود را برای توسعه مدلهای هوش مصنوعی پیشرفته گسترش داده است.
اما آیا این شرکت واقعاً توانسته هزینههای آموزش مدلهای هوش مصنوعی را کاهش دهد، یا ادعاهای اولیه آن بیش از حد خوشبینانه بوده است؟
ادعای کاهش هزینه آموزش مدلهای هوش مصنوعی؛ واقعیت یا تبلیغات؟
دیپسیک در ابتدا مدعی بود که توانسته مدل R1 را تنها با ۶ میلیون دلار و استفاده از ۲٬۰۴۸ پردازنده گرافیکی آموزش دهد، درحالیکه رقبای آمریکایی برای آموزش مدلهای مشابه، میلیاردها دلار هزینه میکنند. اما گزارشهای جدید، واقعیت متفاوتی را نشان میدهند.
طبق بررسیهای مؤسسه SemiAnalysis، این شرکت در حقیقت برای توسعه زیرساختهای خود حدود ۱.۶ میلیارد دلار هزینه کرده و از ۱۰ هزار تراشه H800 و ۱۰ هزار تراشه H100 در کنار سایر پردازندههای گرافیکی سری Hopper بهره میبرد. این دادهها نشان میدهند که رقم ۶ میلیون دلار تنها بخشی از هزینههای پردازشی بوده و سایر هزینههای کلیدی از جمله تحقیق و توسعه، پردازش دادهها و زیرساختهای سختافزاری در نظر گرفته نشده است.
سرمایهگذاری کلان و استراتژی متفاوت دیپسیک
دیپسیک برخلاف بسیاری از استارتاپهای حوزه هوش مصنوعی، بهجای استفاده از سرویسهای ابری، دیتاسنترهای اختصاصی خود را راهاندازی کرده است. این رویکرد به آن اجازه میدهد تا فرآیندهای بهینهسازی و آزمایش مدلهای خود را بهصورت مستقل مدیریت کند و تغییرات لازم را بدون وابستگی به شرکتهای دیگر اعمال نماید.

این شرکت در حقیقت زیرمجموعهای از High-Flyer، یک شرکت سرمایهگذاری چینی با سابقه فعالیت گسترده در حوزه هوش مصنوعی و پردازندههای گرافیکی است. دیپسیک در سال ۲۰۲۳ بهعنوان یک شرکت مستقل تأسیس شد و از همان ابتدا با سرمایهگذاری عظیم و جذب استعدادهای برتر، مسیر رشد خود را بهسرعت طی کرد.
جذب نخبگان هوش مصنوعی با حقوقهای نجومی
یکی از مهمترین نقاط قوت دیپسیک، جذب استعدادهای برتر از دانشگاههای معتبر چین مانند دانشگاه پکن و ژجیانگ است. این شرکت با پرداخت حقوقهای بسیار بالا توانسته محققان برجستهای را به تیم خود اضافه کند. به گفته منابع خبری، برخی از این متخصصان حتی بیش از ۱.۳ میلیون دلار در سال درآمد دارند، رقمی که حتی از حقوق پرداختی غولهای هوش مصنوعی چین مانند مونشات نیز فراتر میرود.
تمرکز دیپسیک بر نوآوری بهجای گسترش سختافزاری
در حالی که بسیاری از شرکتهای فعال در حوزه هوش مصنوعی به دنبال افزایش مقیاس سختافزاری هستند، دیپسیک مسیر متفاوتی را انتخاب کرده است. این شرکت بیشتر روی بهینهسازی الگوریتمها و توسعه فناوریهای جدید تمرکز دارد. یکی از نوآوریهای کلیدی آن، الگوریتم Multi-Head Latent Attention (MLA) است که با هدف کاهش هزینههای پردازشی و افزایش بهرهوری مدلها طراحی شده است. توسعه این الگوریتم ماهها تحقیق و استفاده گسترده از تراشههای گرافیکی پرقدرت را در بر داشته است.
مدیرعامل دیپسیک معتقد است که با استفاده از روشهای هوشمندانه و بهینهسازی الگوریتمها، میتوان با منابع کمتر به نتایج مشابه یا حتی بهتر از رقبا دست یافت. با این حال، واقعیت این است که موفقیت این شرکت صرفاً وابسته به نوآوریهای فنی نیست، بلکه به سرمایهگذاریهای کلان و جذب استعدادهای برتر نیز وابسته است.
آینده دیپسیک؛ چالشها و فرصتها
اگرچه دیپسیک در مدت کوتاهی به یکی از نامهای مطرح در حوزه هوش مصنوعی تبدیل شده، اما همچنان با چالشهای متعددی روبهرو است. رقابت شدید در بازار جهانی، نیاز به تأمین منابع سختافزاری و سرمایهگذاریهای سنگین از جمله موانعی هستند که میتوانند بر مسیر رشد این شرکت تأثیر بگذارند.
با این وجود، اگر دیپسیک بتواند نوآوریهای خود را ادامه دهد و مدلهای قدرتمندتری را با هزینه کمتر توسعه دهد، میتواند به تهدیدی جدی برای رقبای آمریکایی و اروپایی تبدیل شود. حال باید دید که آیا این استارتاپ چینی میتواند وعدههای خود را عملی کند یا خیر.
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: semianalysis.com
ثبت نظر