微软 Azure Neural TTS新增了五种声音模型(神经网络版文本转语音),让我们再次体会到风格迁移技术 AI 强有力的支持语音模型多情感多风格。
芯片采购网专注于整合国内外授权IC代理商现货资源,芯片库存实时查询,行业价格合理,采购方便IC芯片,国内专业芯片采购平台。
更新的五种美式英语声音模型包括青春甜美 Jane、低沉温和的 Nancy、随意而精力充沛 Davis、响亮激昂的 Jason 沙哑粗犷 Tony。在风格迁移技术的支持下,我们不仅快乐 (cheerful)、伤心 (sad)、生气 (angry)、兴奋 (excited)、期待 (hopeful)、友好 (friendly)、不友好 (unfriendly) 和恐惧 (terrified) 等待丰富的情感表现,还有第一次使用的呼喊 (shouting) 和耳语 (whispering) 两种表达方式。到目前为止,用户已经达到了可选的美国英语声音模型 20 丰富的情感和风格使应用场景更加多样化。
风格迁移技术的原理是将一个声音模型的节奏和语调复制到另一个声音模型上,使后者在音色不变的前提下也能有前者的节奏和语调。过去,声音风格的构建主要依靠录音演员录制各种风格的声音数据,然后使用录音数据生成多种风格的智能语音模型,但录音演员很难解释所有风格的声音。风格迁移技术创新地解决了这个问题,可以有效地给予更多 AI 情感和风格的声音。
声音风格和声音情感模型的不断更新,使 Azure Neural TTS 合成语音已广泛应用于各种商业场景中,让用户感受到更现实的语音体验。例如,游戏平台可以快速为角色产生各种情感声音,为游戏增加更个性化的情节表达,使虚拟游戏世界栩栩如生。State of Decay”(腐烂国NDK代理)创作者 —— 微软亡灵工作室 (Undead Labs) 它的使命是为游戏创造一个新的方向,它们应用于游戏开发 Azure Neural TTS。推出包括推出Psychonauts 二、精神病患者 2)多种游戏,包括多种游戏 Double Fine 工作室也在使用 Azure Neural TTS 制作未来游戏项目的原型。音频解决方案提供商 Remixd 集成在其平台中 Azure Neural TTS 的声音模型 Jenny 和 Davis,让客户在创建音频内容时有更多的选择。
关于 Azure Neural TTS
微软 Azure Neural TTS 是 Azure 开发人员可以使用认知服务中强大的语音合成功能 AI 技术将文本转化为逼真的声音。到目前为止,微软 Azure Neural TTS 支持全球 140 提供国家和地区的语言 400 声音模型可以加速声音的自动化生产,帮助各种企业更快地培养满足业务场景的声音,打造专属的声音品牌 —— 无论是呼叫中心、语音助手、有声书制作、聊天机器人、语音导购,还是影视剧 / 动画配音、自媒体短视频、情感电台、教育培训等场景。
持续的技术迭代和版本更新,让 Azure Neural TTS 它能为更多的企业和场景提供逼真、自然、脚踏实地的声音体验。同时,微软的所有技术进步都接受微软的责任 AI 流程指导遵循公平、包容、可靠、安全、透明、隐私、安全、负责任的原则,通过微软负责人工智能办公室 (ORA),人工智能、伦理与工程研究委员会 (Aether),以及负责任 AI 战略管理团队 (RAISE) 监督和实施这些道德标准。
- 唯得科技帮助重庆联通实现5G建设无线信号覆盖
- 问你一个问题:为什么你的4K电视不超高清?
- Pure Storage 旗下Portworx连续三年获评GigaOm Kubernetes存储领导者
- 云迁移后,企业如何充分挖掘数据潜力?
- 苹果回应 App Store 为什么俄罗斯本土社会应用被下架? VKontakte
- PC需求回稳 等到明年下半年
- 美国面临芯片困境:工厂成本比中国高一半,巨额补贴能换取产能吗?
- 小米入股 WiFi 路由器 AP 尊派通讯,芯片公司
- 语音交互应用双屏分体电视系统方案
- 压电能量收集器有望成为电池的替代品
- 提供灿芯半导体MIPI IP完整的解决方案
- 2021年贸易荣获2021年度RECOM目录分销商奖