توجه علاقهمندان به هوش مصنوعی اخیراً به مدل جدید و مقرونبهصرفه GPT-4o mini جلب شده است، در همین حال، اپل تصمیم به گسترش خانواده مدلهای هوش مصنوعی خود گرفته است. بهتازگی، محققان اپل چند مدل متنباز جدید را تحت پروژهای با نام DCLM منتشر کردهاند.
به گزارش AppleInsider، خانواده هوش مصنوعی جدید اپل شامل دو مدل اصلی است: یکی با ۷ میلیارد پارامتر و دیگری با ۱.۴ میلیارد پارامتر. هر دو مدل در بنچمارکها عملکرد بسیار خوبی داشتهاند، بهویژه مدل بزرگتر که عملکرد بهتری نسبت به Mistral-7B دارد و قادر به رقابت با مدلهای متنباز پیشرو مانند Llama 3 از متا و Gemma از گوگل است.
مدلهای هوش مصنوعی متنباز جدید اپل
محققان اپل ادعا میکنند که این مدلها از بهترین مدلهای متنباز با عملکرد بالا هستند. این مدلها با انتشار کد آموزشی و مجموعه دادههای دیگر بهصورت متنباز در پلتفرم Hugging Face در دسترس قرار گرفتهاند. هر دو مدل در بنچمارکهای MMLU امتیاز خوبی کسب کردهاند و قادر به رقابت با مدلهای تجاری دیگر هستند.
مقایسه امتیازات مدل جدید اپل (DCLM-7B) با سایر مدلها
محققان اپل میگویند که مدل بزرگتر در مقایسه با MAP-Neo (پیشرفتهترین مدل متنباز قبلی اپل) بهبود ۶.۶ درصدی در بنچمارکها داشته است، درحالیکه تا ۴۰ درصد از محاسبات کمتری برای آموزش آن استفاده شده است. همچنین نسخه کوچکتر 1.4B این مدل که روی ۲.۶ تریلیون توکن آموزش دیده، عملکرد قابلتوجهی در تستهای MMLU، Core و Extended داشته است.
اپل در اردیبهشتماه نیز مدلهای متنباز OpenELM را در چهار نسخه مختلف با ۲۷۰ میلیون پارامتر، ۴۵۰ میلیون پارامتر، ۱.۱ میلیارد پارامتر و ۳ میلیارد پارامتر منتشر کرد. این مدلها در وظایف مربوط به پردازش متن، مانند نوشتن ایمیل، عملکرد خوبی دارند.
محققان اپل اعلام کردهاند که این مدلهای جدید احتمالاً در هیچیک از محصولات آینده اپل به کار گرفته نخواهند شد و بیشتر بهعنوان پروژههای تحقیقاتی متنباز در نظر گرفته میشوند.
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: appleinsider.com
ثبت نظر