去年12月,我们深入研究了谷歌所致力于的改良文本转语音和其他人工语言用例的工作。在WaveNet神经网络技术(由Alphabet子公司DeepMind所研发)的帮助下,人工语音合成技术变得更加强大并令人印象深刻。它可以让谷歌助理听起来更加自然,并且现在它已成为了一个全新产品的一个组成部分:云文本到语音。
根据谷歌的博客文章所说,这项新服务可以将先进的人工声音应用到不同的领域,例如呼叫中心的语音应答系统,与物联网设备的对话,以及将基于文本的转换为音频。它有32种语言可供您选择,包括英语、西班牙语、法语、德语、日语等等。有些语言甚至可以提供一系列的男性和女性的声音。
在使用了WaveNet技术的语言中,只有美式英语具有6个增强的语音选项(3个男性,3个女性)。据说,WaveNet的升级版生成音频的频率相比旧版本快了1000倍。它的保线位,所有的这些改良都有助于让声音听起来更加像真人。
谷歌的平台现在已经可以处理一些复杂的文本转语音的任务,比如名称、地址和时间的发音,你也可以改变输出声音的音调、速度和音量。谷歌平台支持MP3和WAV格式的声音输出。
有些公司(例如Cisco和Dolphin ONE)已经开始使用云文本转语音,其他感兴趣的企业也可以查看文档和价格以获取更多信息。对于我们其他人来说,仅仅是觉得采样器是很有趣的。小编现在真的很喜欢将各种歌词复制到云文本转语音中。返回搜狐,查看更多
网友评论 ()条 查看