به گزارش خبرگزاری مهر به نقل از انگجت، این فناوری شبیه سازی صدا میتواند با تحلیل یک نمونه صوتی ۱۵ ثانیهای از هر گویندهای تقلید کند.
این شرکت اعلام کرد با صداهایی واقعی و احساسی صحبتی طبیعی را تولید میکند.
این فناوری براساس نوآوری فعلی text to speech API شرکت بنا شده و از سال ۲۰۲۲ میلادی در دست توسعه بوده است. اوپن ای آی قبلاً از نسخهای از مجموعه ابزار برای تقویت صداهای از پیش تعیین شده موجود در API تبدیل متن به گفتار فعلی و ویژگی Read Aloud استفاده کرده است. مجموعهای از نمونهها در وبلاگ رسمی این شرکت وجود دارد و آنها به میزان بسیار زیادی به واقعیت نزدیک هستند.
اوپن ای آی اعلام کرده این فناوری را به عنوان دستیار خوانش، ترجمه زبان و کمک به افرادی با شرایط خاص کاربرد دارد. این شرکت همچنین یک برنامه پایلوت در دانشگاه براون نیز انجام داده که با ایجاد Voice Engine به بیمار دچار اختلالات حرف زدن، کمک کرد.
شرکت از ریسکهای جدی این فناوری به خصوص با توجه به انتخابات ریاست جمهوری پیش رو در آمریکا نیز آگاه است. اوپن ای آی اعلام کرده بازخوردهای مربوط به شرکای بین المللی و آمریکایی از دولتهای مختلف بخشهای رسانه، سرگرمی، تحصیل، مدنی و غیره را نیز در نظر میگیرد تا عرضه محصول با کمترین ریسک تضمین شود.