چند هفته پیش، استارتاپ هوش مصنوعی به نام "ایلان ماسک"، معروف به xAI، نسخه جدید چتبات خود را با نام Grok-1.5 معرفی کرد.
اکنون، در پی رقابت با شرکت OpenAI، این شرکت مدل چندوظیفهای جدید به نام Grok-1.5V یا Grok-1.5 Vision را معرفی کرده است. این هوش مصنوعی به علاوه قابلیت درک متن، قادر به پردازش نمودارها، عکسها و اسکرینشاتها نیز میباشد.
به گفته xAI، نسخه Grok-1.5V توانایی رقابت با مدلهای چندوظیفهای پیشرفته دیگر در زمینههایی مانند استدلال چندرشتهای، درک نمودارهای علمی و تصاویر را دارد. Grok-1.5 Vision به زودی برای افراد انتخابی و برخی از کاربران فعلی چتبات Grok در دسترس قرار خواهد گرفت.
xAI نسخه چندوظیفهای Grok را با رقبایی مانند GPT-4V در هفت بنچمارک مختلف مقایسه کرده است و در برخی از آنها، این مدل عملکرد بهتری نسبت به رقبا داشته است. Grok-1.5V قادر به خواندن متن در تصاویر، فهم مسائل ریاضی، تبدیل فلوچارت به کد پایتون و سایر ویژگیهای جدید میباشد.
xAI مدل چندوظیفهای خود را با رقبایی مانند GPT-4V، Claude 3Sonnet و Gemini Pro 1.5 مقایسه کرده و ادعا میکند که Grok-1.5V در بنچمارک RealWorldQA بهتر از رقبا عمل میکند. این بنچمارک جدید برای ارزیابی درک دنیای واقعی طراحی شده است.
بنچمارک RealWorldQA شامل 700 تصویر همراه با پرسش و پاسخهای مربوط به هر تصویر است که توسط xAI با مجوز Creative Commons منتشر شده است.
تاکنون، استارتاپ هوش مصنوعی ایلان ماسک پیشرفتهای زیادی داشته است و همیشه در تلاش برای رقابت با شرکتهای بزرگ هوش مصنوعی مانند OpenAI است. در طول این مسیر، چتبات Grok موفق به جلب توجه و تحولات بسیاری شده است. اخیراً تحقیقات نشان داده است که Grok قادر است به کاربران درباره اقدامات مجرمانه اطلاعات دهد.
اما xAI در تلاش است تا "هوش مصنوعی جامع و مفید" را برای درک جهان ایجاد کند و این هدف نشان میدهد که در ماههای آینده بهروزرسانیهای قابلتوجهی برای Grok در زمینههای درک چندوظیفهای و ویژگیهای هوش مصنوعی مولد خواهد آمد.
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: x.ai
ثبت نظر