به تازگی گزارش شده است که شرکتهای گوگل و OpenAI از ویدیوهای یوتیوب به عنوان منبعی برای آموزش برخی از مدلهای هوش مصنوعی خود بهرهبرداری کردهاند.
به نظر میرسد که OpenAI و گوگل از کپیبرداری ویدیوهای یوتیوب بهمنظور آموزش مدلهای هوش مصنوعی خود استفاده کردهاند؛ این عمل ممکن است با قوانین حق تکثیر صاحبان محتوا در تضاد باشد.
گزارش اخیر نیویورک تایمز به تلاشهای گستردهی OpenAI، گوگل و متا برای افزایش حجم دادههای موردنیاز برای آموزش مدلهای هوش مصنوعی اشاره میکند. این گزارش در عرض چند روز پس از مصاحبه نیل موهن، مدیرعامل یوتیوب با بلومبرگ، منتشر شد؛ مصاحبهای که در آن موهن بیان کرد استفاده OpenAI از ویدیوهای یوتیوب برای آموزش مدل سورا مخالفت با قوانین این پلتفرم است.
گفته میشود که OpenAI با استفاده از ابزار تشخیص صدای خود به نام Whisper، بیش از یک میلیون ساعت ویدیوی یوتیوب را به متن تبدیل و از این دادهها برای آموزش مدل هوش مصنوعی قدرتمند GPT-4 استفاده کرده است.
قبلاً، نشریهی The Information گزارش داده بود که OpenAI از ویدیوها و پادکستهای یوتیوب برای آموزش دو سیستم هوش مصنوعی خود بهره برده است.
مت برایانت، سخنگوی گوگل، در گفتوگو با نیویورک تایمز اظهار کرد که گوگل، با توجه به قوانین خود که استخراج یا دانلود غیرمجاز محتوای یوتیوب را منع کرده است، نسبت به استفادهی OpenAI از این دادهها اظهار بیاطلاعی دارد.
ظاهراً برخی از افراد در گوگل اطلاع داشتند که برخی شرکتها از دادههای یوتیوب برای آموزش مدلهای هوش مصنوعی خود استفاده میکنند، اما به دلیل اینکه گوگل نیز همین کار را انجام میدهد، هیچ اقدامی علیه OpenAI انجام ندادهاند. گوگل ادعا میکند که فقط از ویدیوهایی استفاده کرده است که صاحبان آنها به این کار موافقت کردهاند.
در ژوئن ۲۰۲۳، گوگل از یکی از تیمهایش خواست بهمنظور استفادهی گستردهتر از محتواهای عمومی از جمله اسناد گوگل درایو و گوگل شیت برای آموزش مدلها و محصولات هوش مصنوعی، سیاست حفظ حریم خصوصی خود را بهروزرسانی کند.
اگر علاقهمند دنیای تکنولوژی هستید حتما شبکههای اجتماعی فیسیت را در اینستاگرام، تلگرام، روبیکا، توییتر و آپارات را دنبال کنید.
منبع خبر: nytimes
ثبت نظر