مدل هوش مصنوعی جدید OpenAI قادر است تا با استفاده از فایلهای صوتی ۱۵ ثانیهای، صدای افراد را بازسازی نماید. اخیراً، OpenAI موتور صدا (Voice Engine) را معرفی کرده است که قادر است متنی را با یک صدای مشابه به صدای افراد، بخواند.
تاریخ عمومیشدن این ویس انجین هنوز مشخص نشده است و انتظار میرود که OpenAI روش استفاده مسئولانه از این ابزار را اعلام نماید تا از هرگونه سوءاستفاده احتمالی جلوگیری شود، به ویژه با توجه به نگرانیهای مرتبط با گسترش فناوریهای دیپ فیک.
جف هریس، یکی از اعضای تیم محصول OpenAI، در یک مصاحبه اظهار داشته است: "ما به دنبال اطمینان از این هستیم که همه احساس رضایت از روند استفاده از ویس انجین داشته باشند. ما به خطرات احتمالی این فناوری آگاهی داریم و برای آن راهحلهایی را در نظر گرفتهایم."
هریس ادامه داد: "ما یک نمونه کوچک از صدا و متن را دریافت میکنیم و سپس یک صدای بازسازی شده که کاملاً شبیه صدای اصلی است، تولید میکنیم. صدای اصلی پس از اتمام فرآیند، حذف میشود. همچنین، اگر متن دادهشده شامل اجزاء سؤالی یا تعجبی باشد، تن صدای تولیدشده نیز متناسب با آن تغییر میکند."
توسعه ویس انجین OpenAI از اواخر سال ۲۰۲۲ آغاز شده است و از آن برای تولید صداهای استاندارد موجود در API تبدیل متن به گفتار و ابزار مکالمهی صوتی ChatGPT استفاده شده است. OpenAI از آن زمان به دلیل مخاطرات احتمالی سوءاستفاده، بهصورت محتاطانه به انتشار گستردهتر این فناوری پرداخته است.
API تبدیل متن به گفتار OpenAI از اوایل سپتامبر ۲۰۲۳ (شهریور و مهر ۱۴۰۲) عرضه شده و شرکتهایی مانند اسپاتیفای آن را برای دوبلهی پادکستها در زبانهای مختلف به کار بردهاند.
این ابزار هوش مصنوعی جدید OpenAI میتواند به طور جدی تهدیدی برای آیندهی شغلی گویندگان و صداپیشگان باشد، احتمالاً زمانی که از آنها خواسته شود که حق استفاده از صدای خود را برای تولید نسخههای ساختگی اعطا کنند و بهتدریج توسط هوش مصنوعی جایگزین شوند.
اگر به اخبار دنیای تکنولوژی علاقه مند هستید، ما را در شبکههای اجتماعی مختلف تلگرام، روبیکا، توییتر، اینستاگرام و آپارات همراهی کنید.
منبع خبر: openai.com
ثبت نظر