柯南变声器的算法原理解析
柯南昨天上热搜了,柯南今天分享下一个在刑侦破案中非常有用的变声技术—变声器的实现效果
0 1
小时候特别喜欢看柯南,里面有个变声蝴蝶结,算法让我印象深刻。原理变声蝴蝶结的解析作用就是可以把输入的语言转化成其它人的声音。举个例子,柯南如果我有这个语音转换功能,变声下次录歌的算法时候就可以用周杰伦的声音录制(唱功还是自己的
)。
如果要实现变声功能,这里面包含哪些技术点呢,解析首先要提取出语音中的柯南3种表征:
内容表征:输入语音的具体内容
声纹表征:可以理解为人的声色,每个人都是变声不同的
说话风格表征:说话的语气、强弱、算法快慢等风格相关
通过上述分析,原理如何实现变声功能就比较好理解了。解析首先把语音分解为内容表征、声纹表征、说话风格表征3种特征,然后把声纹表征替换成其他人的声纹特征即可实现。
0 2
那么声纹识别如何实现就成了变声功能的关键。先看下声音信号是什么样的:
大家应该在各种k歌工具中都多少了解些声音信号的样子,基本上声音信号就是一堆脉冲。脉冲是一个时序信号数据,很难处理。需要对声音时序信号进行傅里叶转换,才能转换成频谱图(学过通信的同学应该比较好理解,通信专业的我当年碰到傅里叶这3个字就抖),转换效果如下图:
傅里叶转换后的图其实就成了一个与时间无关的图,所以就可以通过深度学习CNN算法去学习规律,对于深度学习有了解的同学应该知道CNN可以快速学习图像中的一些细节差别,其实根本原理跟人脸识别或者文字识别等场景都是一致的,于是就可以基于这种方法实现对于语音信号的声纹的分析和识别。
0 3
上文大概讲了下变声这个功能的大体理论以及声纹识别的算法原理,接下来讲一个适用场景吧,早在14年我在某外资手机巨头做手机软件开发的时候就想到一个场景,通过声纹识别解决骚扰电话。
当时想的方法是这样的:首先通过声纹识别把用户所有有关联的人的声纹pattern都识别出来,存储到手机内。一旦有个电话进来,先不着急接通,而是要求拨电话的人说一句话,这时候马上识别他的声纹与手机中存储的声纹pattern作比对。如果拨电话的人的声纹是一个新声纹,则判定为骚扰电话,拒绝接通~
现在想想,那时候这种通过声纹识别拦截骚扰电话的想法还是挺超前的。好啦,今天就简单分享到这里,谢谢大家,希望能对大家有所帮助~
- ·阜阳微生物检验员招聘信息页介绍
- ·原创时尚就是一个轮回,90年代穿搭,妈妈们的搭配可比你时髦多了
- ·2020年农历十月二十七日宜忌什么是好日子吗?
- ·十月的英文是什么
- ·【美妆】胆大心细才能玩儿转眼线笔!
- ·2021年经典朋友圈语录大汇总78条
- ·三国群英传6最变态的十大武将技与组合技(最厉害)
- ·一起来领略普林斯顿微积分和宋浩老师的双重魅力吧!
- ·【愚论】渊下宫:提瓦特最【阴间】的地图
- ·【原】【广东珠海 廖院玲】原创//在母亲节那天第一次收到的惊喜和幸福感
- ·老当益壮!8天内3场进3球 老魔兽扛起进攻大旗
- ·武昌华师3dmax室内设计培训、武汉室内设计培训
- ·OW丨炎炎夏日来袭,这个世界需要更多的水枪!!!2019夏日运动会皮肤鉴赏
- ·内科住院医师:医学影像试题(强化练习)
- ·QQ皮肤特权
- ·3dmax轮胎建模教程 3d max轮胎
- ·阳光总在风雨后-景甜 高清MV迅雷下载
- ·同济大学关于宿舍光网及无线网申请与使用的通告
- ·励志卡的内容(励志心愿卡怎么写)
- ·【魅族MX 四核/16GB】报价
- ·从医30余年,远东妇产医院不孕专家丁奎民为何被患者称为“送子观音”?
- ·上一篇:我院校友六律所副主任曹文律师应邀参加浙江“社会普法大讲堂”走近民企网络直播活动
- ·【网贷口子行情报486期】现金巴士无法打款问题解决技巧,信用卡的最低还款和分期还款 ...
- ·wifi上网账号是什么意思?这个有什么用?
- ·蜡笔小新qq透明皮肤(蜡笔小新qq分组) v2014最新版
- ·全球购公爵黑卡APP页面打不开客服联系不上如果真的已经停止对我服务请赔偿我的损失