新闻资讯 公司新闻

好家伙,大叔变声“妙音娘子”只需一步

2022.05.28

738

市民呼入到某市12345热线,坐席接听后邀请第三方部门进行三方通话。

与以往不同的是,坐席、所属部门听到市民的声音是变声的。

在通话中,感觉是一位声音甜美的“妙音娘子”,

实则,在通话背后的是一位铿锵有力的中年男士。

现实生活中,人们追求个性,更注重隐私。

在人工智能技术加持下,智能交互将不仅需要满足多场景下的交互需求,客户体验也迎来了革新,在帮助用户展现自己的“多面人格”的同时,保障用户的隐私权利。



在音频处理领域,“变声”是一个相对常见的功能,语音消息的变声不难,但是在类似12345热线中实时变声,却是个大挑战。要保证在用户无感的超低延时下对人声进行特殊处理,怎么办呢?


变声的原理,是通过改变人声的音调、音色,使输出声音在感官上与原始声音不同。通过提取原声语音中的内容信息,包括原声的节奏和情感,再结合特定人的音色进行转换结合,复刻模仿特定人的声音。这种基于音色与内容分离的声音转换技术,实现了声音的cosplay,对用户本身的音色没有任何限制。 

模块协作图


远传科技推出了MVGateWay变声技术,是智能语音方面新的突破,语音变声不仅能实现说话人音色的逼真转换,而且还能将说话人的语速、停顿等韵律、情感、言语方式在所指定的人物角色逼真体现出来,在不同人的声音中切换自如实现自然的变声效果。

▼ 可实现以下功能 ▼

音色个性化定制:根据客户场景,灵活定制各类变声音色,如大叔变萝莉;大叔变“妙音娘子”;

多场景变声服务:针对变声需求,提供语音实时变声、非实时变声,灵活满足不同场景

高性能服务保障:提供300路坐席并发的服务支撑

稳定技术接口:满足多种产品端接入需求,提供稳定技术接口,可灵活定制


远传科技的MVGateWay变声技术不仅可以对通话中声音的变声处理和控制,完成对呼叫的控制和对媒体的控制,还兼容远传科技自研的全媒体智能交互中心U-IPCC系统,并作为一个补充模块加入到U-IPCC 7.0系统中,实现启动变声控制、停止变声控制、呼叫控制、媒体控制等功能。在专业客服、声音美化、虚拟IP、电商直播等领域有着丰富的应用空间。满足客户多种应用场景下实现语音“变声”,让交互体验更加丰富。

The End