听歌识曲不能识别真人清唱?准确度受什么影响?
前几天,试玩了网易云音乐的听歌识曲;
当然不是识别播放器中的歌曲,是我和两个朋友清唱,总共唱了十几首中文歌曲,包括薛之谦、五月天的热门歌曲,还有熟悉的两只老虎;
然而结果是没有一首能够识别出来,而且大部分识别出的是英文歌曲,2首是韩文歌曲;
也许我们唱的太难听?也不至于全部不能识别吧!而且中文识别为英文,这差距!
所以,听歌识曲的准确度的影响因素有哪些?
并不是太难听,不管有多好听,清唱都识别不出来。播个bgm还有可能,你需要知道听歌识曲是怎么识别的。
首先说一下以图搜图的做法,一般情况下一张图片是由亿万个像素点组成的,但是图片是一张图,怎么做到像文字那样的匹配对应呢?目前的做法基本都是把图片转化为64个左右的像素图类似这样(图1-1),然后再进行匹配。
歌曲也是同样的道理,每首歌的频率都是不一样的,就算同个人唱第二遍,人声部分也是不一样的,但是整首歌的bgm是一样的,基本旋律也是一样的,那么一般的做法会在歌曲中每个段落曲一些频率的特征点,然后进行特征点的匹配,找到最近似相同的歌曲。
接下来,简单说说下听歌识曲的两种方法,对算法要求和识别率要求较高。
- 短时音调-时间图,曲库里存储的是每首歌的标准音调序列。如:Shazam、QQ音乐等App,对录音(wav波形声音)进行傅里叶变换,得出这段录音的频谱。(感兴趣的可以上百度百科查查)
语音信号共振峰。基于LPC(线性预测编码)方法提取的语音信号共振峰,共振峰决定元音的音质。
数据源自:《LPC方法提取语音信号共振峰的分析》
如果是可以识别哼唱功能的,建议题主用soundhound这款软件,国内的话,推荐QQ 音乐的哼唱识别功能。
了解了听歌识曲的算法后,影响就简单了。
- 内部因素
第一个是技术:算法和歌曲识别率。
第二个是曲库:储存了多少歌曲。
- 外部因素:网速、每个人的发音、环境如何(是否有噪音)等等都能影响到。
这个答案是抛钻引钰,希望更多人来解答。
文/ 丨虫子丨 某网 产品经理
关键字:产品经理, 识别
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!