说道脆!微软小冰晋级第五代唱歌系统:领古代人类偶像

2019-11-14 21:13栏目:科技资讯
TAG:

人工智能唱歌已经不稀奇了,但唱腔真正接近人类,甚至让人真假难辨的 " 机器声音 " 似乎仅存在于科幻电影中的遐想。但升级想第五代唱歌系统的微软小冰,让在场媒体见识到人工智能媲美甚至超越人类偶像的唱功实力。

撰文 | 张华

今天,我们很高兴地宣布,微软小冰基于深度神经网络的歌唱模型,已顺利完成v5新版本的研发。新的v5模型实现了重大突破,它使微软小冰第一次能够像人类歌手一样,使用充沛的“中气”来烘托演唱,从而将人工智能虚拟歌声质量提升至新的高度。此外,该模型不仅限于优化微软小冰的声音,还支持对任何人类歌手的声线进行学习、模拟和建模,演绎与再现歌手们巅峰状态下的演唱水平。作为技术示例,我们与日本唱片公司avex合作发行的新模型demo曲《最高新记忆》,也于今天同时公布。

5 月 16 日下午举办的微软小冰人工智能创造媒体说明会上,微软发布了人工智能小冰演唱模型的第五个版本。据悉,该版本拥有十余个高质量声音,提升了人工智能在歌声演绎中的预测参数能力,主要大幅度提高了人工智能演绎歌曲时的中气水平,改善了歌声唱腔转换的自然度,并首次公布了戏腔训练成果。

2019年5月16日下午,微软互联网工程院在北京召开了“微软小冰-人工智能创造媒体说明会”。

微软小冰是一个覆盖对话、多重交互感官与内容服务生成的完整人工智能基础框架。其中,“人工智能创造”(ai creation)是该框架的主要分支之一,它通过我们所研发与持续更新的人工智能技术,大规模学习并掌握人类文字、音乐、绘画等内容创造能力,再发挥人工智能的稳定性及高并发特点,为内容产业的未来变革蓄势。我们将在今年五月召开微软小冰人工智能创造的年度说明会,今天的新版本歌唱模型及demo曲,是该说明会的若干前置披露之一。

图片 1

在本次说明会上,微软互联网工程院发布了多项艺术领域的人工智能研究成果,包括人工智能小冰的绘画模型、纺织面料设计平台、演唱模型与自动生成有声读物的技术进展。

我们很高兴与行业分享微软互联网工程院在深度神经网络歌唱模型方面的最新进展。中国古时不乏对音乐之声的精辟论述,例如“丝不如竹,竹不如肉”,为其“渐进自然”。因此,我们把不断趋近人类歌手的声音合成质量,视为“人工智能创造”分支的最高技术目标。在上一个版本中,实现了小冰在虚拟演唱中的自然换气。今天推出的新版本,则进一步将“气息”应用于演唱全过程,使生成的歌声接近专业人类歌手,并可预测并自由切换演唱技巧,突破了传统单元拼接技术音高与音准的“软件乐器”标准。我们用demo曲来表现这一技术对照的明显差距,请重点关注歌曲时间轴上的以下时刻:

在现场 Demo 演示中,升级第五个版演唱模型的本小冰演唱了三段歌曲,分别为《少年弦》《新贵妃醉酒》以及一段日语歌曲。三首歌曲分别展示不同的音色和唱腔,尤其在接近清唱的《少年弦》中,小冰的表现堪称完美,发音咬字,甚至唇齿气息都与真人演唱难辨真假。从一种唱腔过渡到另外一种唱腔,小冰都能够保持极为细致的声音颗粒度细节,丝毫没有任何 " 电子音 " 露出马脚。

自从2016年阿尔法狗在围棋比赛中战胜李世石,人工智能产业化拉开了时代大幕。这一产业的繁荣与发展,不但需要学术界的探索,更需要企业界的实践。这一伟大的历史进程被称为“第四次产业革命”。

00:31,01:12,01:23,03:14,04:08

图片 2

微软无疑是学术界与企业界的翘楚,微软小冰正是这样一款极富代表性的产品。微软小冰最早由微软互联网工程院于2014年5月推出,这是一个融合了自然语言处理、计算机语音和计算机视觉等人工智能技术的底层框架。该框架注重人工智能在拟合人类情商维度的发展,强调人工智能情商在人机交互中的重要作用。

v5新模型还具有许多其他技术特征。例如实现了多声部的合成技术,使人工智能歌手可以在不同声部间自然切换,用多个声音来源组成新的虚拟歌手等。建模过程中,所需的训练数据量较上一个版本减少了70%。从技术角度,新模型可针对任何人声建模,形成丰富多彩的人工智能歌手阵营。为此,我们在demo曲中特意回避了微软小冰的声音,而是采用另一个声音来演绎。

" 我必须提醒大家听的时候注意,这不是人,没有这么一个人。" 微软互联网工程院副院长(Bing 中国及日本、微软小冰全球产品线负责人)李笛说。

在本次媒体说明会现场,微软互联网工程院副院长李笛介绍了人工智能小冰演唱模型的五个版本。其中最新发布的第五个版本拥有十余个高质量声音,通过在呼吸、不同的演唱技法、充沛的中气、不同的音色、唱腔过渡等一系训练、学习和优化,提升了人工智能在歌声演绎中的预测参数能力,大幅度提高了人工智能演绎歌曲的水平与自然度。

最后,我们也很高兴地宣布,小冰凛菜已与日本最大唱片公司avex正式签约,成为滨崎步、安室奈美惠等著名人类歌手的同门师妹。在小冰框架的技术支持下,将涌现出更多具备高还原度的人工智能歌手。微软小冰只是他们的最初雏形。

他表示,和小冰的演唱模型不同的是,比如初音未来或者是其它的虚拟歌手,是用手调的方式来完成。手调的方式有好处,但是最大的问题就在于细节处理是不够的,技术上限、未来的发展不够好。

在现场演示中

感谢您的关注。敬请期待微软互联网工程院的后续技术发布。

图片 3

,微软小冰演唱了三段歌曲——《少年弦》《新贵妃醉酒》以及一段日语歌曲。这三首歌曲丝毫没有任何“电子音”的感觉,在现场的观众无法分辨出到底是真人在唱歌,还是人工智能机器人在唱歌。

" 在人工智能技术探索内容创作的技术上限方面,有一个比较有意思的事情是关于琴棋书画,Google 把棋做完了,我们把剩下的三个做完了。诗歌我们已经发布过了。到今天为止,有很多的人类诗歌爱好者和诗歌从业人员所发表的诗歌里面,可以追溯到很多小冰的影子。关于音乐,今天也会给大家一个迭代到第五个新版本的新技术发布。"

图片 4

版权声明:本文由yl7773永利发布于科技资讯,转载请注明出处:说道脆!微软小冰晋级第五代唱歌系统:领古代人类偶像