网易有道开源情感语音合成引擎EmotiVoice:一种功能强大且现代化的文本转语音引擎

网易有道开源情感语音合成引擎EmotiVoice:一款强大且现代化的文本转语音引擎

网易有道宣布正式发布了开源的文字转语音(TTS)引擎“一墨声”(EmotiVoice)。链接:点击这里。它提供的网络和脚本接口可以批量生成结果,非常适用于需要情感音色合成的应用。

有道创建了这个文字转语音引擎,目前拥有超过2000种音色,支持中文和英文。它还具备独特的情感合成功能,可以生成喜悦、激动、悲伤或愤怒等多种情感,以及大量表达性的语音。

在开源的文字转语音引擎中,一墨声位居前列。它拥有2000多种独特的声音,并可以用中文和英文进行对话。最引人注目的功能是情感合成,可以生成具有广泛情感的语音,包括快乐、兴奋、悲伤、愤怒等等。

它提供了用户友好的在线界面,也可以通过脚本界面批量生成结果。使用Docker镜像可以方便地测试一墨声。需要一台带有NVidia图形处理单元的计算机,在Linux或Windows WSL2上安装NVidia容器工具包。

在当前系统中,提示语管理用户的情感和行为,而舍弃了性别,更侧重于语调、节奏、强度和激情。可以很容易地添加类似于原始闭源设计的风格/音色控制器。

本文来源:网易有道开源一墨声:一款强大现代的文字转语音引擎,首发于MarkTechPost