اپل امروز مدلهای زبانی بزرگ هوش مصنوعی (LLM) جدیدی را با قابلیت اجرای بدون نیاز به اینترنت معرفی کرده است.
به گفته اپل، این مدلهای OpenELM (مدلهای زبانی کارآمد متنباز) برای اجرا روی دستگاهها بهصورت محلی طراحی شدهاند و از سرورهای ابری وابسته نیستند. این مدلها در Hugging Face Hub، یک جامعه برای به اشتراکگذاری کدهای هوش مصنوعی، در دسترس قرار دارند.
اپل اعلام کرده است که هشت مدل OpenELM مختلف وجود دارد، که چهار مدل از آنها با استفاده از کتابخانه CoreNet آموزش دیدهاند و چهار مدل دیگر با دستورالعملهای آموزش دادهشدهاند. اپل از یک استراتژی مقیاسبندی لایهای برای بهبود دقت و کارایی مدلها استفاده کرده است.
اپل این مدلها را بهصورت کدها، گزارشهای آموزشی، و نسخههای متعدد منتشر کرده است، به جای ارائه مدلهای آموزشدیدهی نهایی. این اقدام به اعتقاد محققان منجر به پیشرفت سریعتر و نتایج قابلاعتمادتر در زمینه هوش مصنوعی میشود.
بهگفته اپل، این مدلهای جدید شامل چارچوب کاملی برای آموزش و ارزیابی در دیتاستهای عمومی هستند، شامل گزارشهای آموزشی و دادههای مربوطه.
اپل امیدوار است که با اشتراکگذاری این مدلها، افراد و شرکتها بتوانند از آنها بهرهمند شوند و همچنین به توسعه و بهروزرسانی آنها کمک کنند.
بهطور کلی، این اقدام اپل به نظر میرسد یک گام مهم در راستای توانمندسازی جامعه تحقیقاتی متنباز و توسعهدهندگان هوش مصنوعی است. هنوز اپل این مدلها را به دستگاههای خود نیاورده است، اما انتظار میرود که ویژگیهای مبتنی بر هوش مصنوعی در آیندهی iOS 18 ارائه شود.
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: arxiv
ثبت نظر