نرم افزار تقلید صدا برای اولین بار در ایران توسط فارغ التحصیل کارشناسی ارشد دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر طراحی و تدوین شد.

به گزارش خبرگزاری مهر، بهروز مکی مجری طرح گفت : تبدیل گوینده با استفاده از شبکه های عصبی غیر خطی یعنی صدای فرد ضبط می شود و با تغییراتی که بر روی آن اعمال می شود به نظر می رسد که فرد دیگری صحبت کرده و صدا به نوعی تغییر می کند.

مکی یاد آور شد : این نرم افزار در سیستم های تبدیل متن به گفتار استفاده می شود و به علت اینکه سطح پردازش آنها خیلی زیاد است معمولا صدا ضبط شده را با این نرم افزار تغییر داده و تبدیل به صدای فرد دیگری می شود.

مجری طرح گفت : این نرم افزار برای کسانی که مشکل گویش دارند به بهبود صدای آنها کمک کرده و گرفتگی صدا و ... را رفع می کند.

دانش آموخته دانشگاه صنعتی امیر کبیر ادامه داد : از روش فوق می توان در کارهایی که با اینترنت مرتبط می شود استفاده کرد، مثلا می توان ایمیل را با صدای فرستنده شنید.

وی گفت : در این روش صدا ضبط می شود، پارامترهای مخصوصی از آن استخراج شده و بعد پارامترها به شبکه ارسال می شود و با استفاده از شبکه های عصبی غیر خطی پارامترها تبدیل شده و به فضای سیگنال بر می گردانیم و سپس به انجام یکسری فعالیتهای جزئی کیفیت صدا بهبود می یابد.

مکی افزود : چون شبکه های عصبی یک سیستم پیوسته است تا حدودی این قابلیت را دارد که بخشی از خرابی سیگنال را دوبار ترمیم کند.