گوگل بهتازگی از یک ابزار پیشرفته هوش مصنوعی به نام Whisk رونمایی کرده که کاربران را قادر میسازد با الهام از تصاویر موجود، محتوای بصری منحصربهفرد و خلاقانهای خلق کنند.
برخلاف روشهای مرسوم که نیاز به دستورات متنی پیچیده دارند، Whisk با تحلیل تصاویر ورودی، امکان تولید تصاویر جدید را به روشی ساده و کارآمد فراهم میکند.
عملکرد Whisk: ترکیبی از متن و تصویر
این ابزار به کاربران اجازه میدهد برای تولید تصاویر نهایی خود، سه عنصر اصلی یعنی موضوع، سبک، و صحنه را مشخص کنند. کاربران میتوانند برای هر یک از این بخشها، چندین تصویر نمونه ارائه دهند تا هوش مصنوعی بر اساس آنها خروجی تولید کند. همچنین امکان وارد کردن متن برای تکمیل جزئیات تصویر وجود دارد، هرچند این مرحله کاملاً اختیاری است.
اگر تصویری برای شروع ندارید، آیکون تاس در این ابزار به کمک شما میآید. با یک کلیک، Whisk بهطور خودکار تصاویری را بهعنوان الگو پیشنهاد میدهد. کاربران میتوانند با وارد کردن توضیحات متنی، تغییرات دلخواه خود را اعمال کرده یا نتایج تولیدشده را مستقیماً ذخیره و دانلود کنند. همچنین، این ابزار امکان ویرایشهای بیشتر از طریق تغییر متن یا انتخاب تصویر جدید را ارائه میدهد.
ویژگیهای کلیدی Whisk
- Whisk برای کاوش سریع و بصری طراحی شده است و هدف آن تولید تصاویر باکیفیت بر اساس الهام بصری است، نه انجام ویرایشهای دقیق پیکسل به پیکسل.
- این ابزار برای هر تصویر تولیدی، توضیحات متنی مرتبطی نیز ارائه میدهد که میتواند برای دستهبندی یا اشتراکگذاری مفید باشد.
- کاربران در صورت نیاز، امکان بازنگری و ویرایش متنهای زیربنایی تصاویر را نیز دارند.
Whisk از نسخه جدید مدل هوش مصنوعی Imagen 3 بهره میبرد که بهطور ویژه برای تولید تصاویر دقیق و واقعگرایانه طراحی شده است. علاوه بر این، گوگل مدل تولید ویدیوی پیشرفته خود با نام Veo 2 را نیز معرفی کرده که درک عمیقی از مفاهیم زبان بصری و فیلمبرداری دارد و مشکلات متداول مدلهای مشابه، مانند تولید جزئیات نادرست، در آن به حداقل رسیده است.
محدودیتها و چالشهای Whisk
گوگل اذعان کرده که این ابزار ممکن است در برخی موارد خروجی دقیقی ارائه ندهد. به همین دلیل، قابلیتهای ویرایشی متنوعی در Whisk گنجانده شده تا کاربران بتوانند نتایج را مطابق با نیازهای خود بهبود دهند.
ابزار Whisk گامی نوین در جهت خلق تصاویر مبتنی بر هوش مصنوعی است که فرآیند تولید محتوای بصری را سریعتر، خلاقانهتر و سادهتر از گذشته میکند. این ابزار برای طراحان، تولیدکنندگان محتوا و علاقهمندان به کاوشهای بصری یک راهکار منحصربهفرد ارائه میدهد.
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: blog.google/technology
ثبت نظر