Azure 语音合成增加了新的声音，风格迁移技术实现了不同音色的多情感诠释

Azure 语音合成增加了新的声音，风格迁移技术实现了不同音色的多情感诠释

（2025年3月29日更新）

微软 Azure Neural TTS新增了五种声音模型(神经网络版文本转语音)，让我们再次体会到风格迁移技术 AI 强有力的支持语音模型多情感多风格。

芯片采购网专注于整合国内外授权IC代理商现货资源，芯片库存实时查询，行业价格合理，采购方便IC芯片，国内专业芯片采购平台。

更新的五种美式英语声音模型包括青春甜美 Jane、低沉温和的 Nancy、随意而精力充沛 Davis、响亮激昂的 Jason 沙哑粗犷 Tony。在风格迁移技术的支持下，我们不仅快乐 (cheerful)、伤心 (sad)、生气 (angry)、兴奋 (excited)、期待 (hopeful)、友好 (friendly)、不友好 (unfriendly) 和恐惧 (terrified) 等待丰富的情感表现，还有第一次使用的呼喊 (shouting) 和耳语 (whispering) 两种表达方式。到目前为止，用户已经达到了可选的美国英语声音模型 20 丰富的情感和风格使应用场景更加多样化。

风格迁移技术的原理是将一个声音模型的节奏和语调复制到另一个声音模型上，使后者在音色不变的前提下也能有前者的节奏和语调。过去，声音风格的构建主要依靠录音演员录制各种风格的声音数据，然后使用录音数据生成多种风格的智能语音模型，但录音演员很难解释所有风格的声音。风格迁移技术创新地解决了这个问题，可以有效地给予更多 AI 情感和风格的声音。

声音风格和声音情感模型的不断更新，使 Azure Neural TTS 合成语音已广泛应用于各种商业场景中，让用户感受到更现实的语音体验。例如，游戏平台可以快速为角色产生各种情感声音，为游戏增加更个性化的情节表达，使虚拟游戏世界栩栩如生。State of Decay”（腐烂国NDK代理)创作者 —— 微软亡灵工作室 (Undead Labs) 它的使命是为游戏创造一个新的方向，它们应用于游戏开发 Azure Neural TTS。推出包括推出Psychonauts 二、精神病患者 2)多种游戏，包括多种游戏 Double Fine 工作室也在使用 Azure Neural TTS 制作未来游戏项目的原型。音频解决方案提供商 Remixd 集成在其平台中 Azure Neural TTS 的声音模型 Jenny 和 Davis，让客户在创建音频内容时有更多的选择。

关于 Azure Neural TTS

微软 Azure Neural TTS 是 Azure 开发人员可以使用认知服务中强大的语音合成功能 AI 技术将文本转化为逼真的声音。到目前为止，微软 Azure Neural TTS 支持全球 140 提供国家和地区的语言 400 声音模型可以加速声音的自动化生产，帮助各种企业更快地培养满足业务场景的声音，打造专属的声音品牌 —— 无论是呼叫中心、语音助手、有声书制作、聊天机器人、语音导购，还是影视剧 / 动画配音、自媒体短视频、情感电台、教育培训等场景。

持续的技术迭代和版本更新，让 Azure Neural TTS 它能为更多的企业和场景提供逼真、自然、脚踏实地的声音体验。同时，微软的所有技术进步都接受微软的责任 AI 流程指导遵循公平、包容、可靠、安全、透明、隐私、安全、负责任的原则，通过微软负责人工智能办公室 (ORA)，人工智能、伦理与工程研究委员会 (Aether)，以及负责任 AI 战略管理团队 (RAISE) 监督和实施这些道德标准。

产品与应用：

每日新闻头条：

芯片采购网专注整合国内外授权IC代理商的现货资源，轻松采购IC芯片，是国内专业的芯片采购平台