
微软 Azure Neural TTS新增了五种声音模型(神经网络版文本转语音),让我们再次体会到风格迁移技术 AI 强有力的支持语音模型多情感多风格。
芯片采购网专注于整合国内外授权IC代理商现货资源,芯片库存实时查询,行业价格合理,采购方便IC芯片,国内专业芯片采购平台。
更新的五种美式英语声音模型包括青春甜美 Jane、低沉温和的 Nancy、随意而精力充沛 Davis、响亮激昂的 Jason 沙哑粗犷 Tony。在风格迁移技术的支持下,我们不仅快乐 (cheerful)、伤心 (sad)、生气 (angry)、兴奋 (excited)、期待 (hopeful)、友好 (friendly)、不友好 (unfriendly) 和恐惧 (terrified) 等待丰富的情感表现,还有第一次使用的呼喊 (shouting) 和耳语 (whispering) 两种表达方式。到目前为止,用户已经达到了可选的美国英语声音模型 20 丰富的情感和风格使应用场景更加多样化。
风格迁移技术的原理是将一个声音模型的节奏和语调复制到另一个声音模型上,使后者在音色不变的前提下也能有前者的节奏和语调。过去,声音风格的构建主要依靠录音演员录制各种风格的声音数据,然后使用录音数据生成多种风格的智能语音模型,但录音演员很难解释所有风格的声音。风格迁移技术创新地解决了这个问题,可以有效地给予更多 AI 情感和风格的声音。
声音风格和声音情感模型的不断更新,使 Azure Neural TTS 合成语音已广泛应用于各种商业场景中,让用户感受到更现实的语音体验。例如,游戏平台可以快速为角色产生各种情感声音,为游戏增加更个性化的情节表达,使虚拟游戏世界栩栩如生。State of Decay”(腐烂国NDK代理)创作者 —— 微软亡灵工作室 (Undead Labs) 它的使命是为游戏创造一个新的方向,它们应用于游戏开发 Azure Neural TTS。推出包括推出Psychonauts 二、精神病患者 2)多种游戏,包括多种游戏 Double Fine 工作室也在使用 Azure Neural TTS 制作未来游戏项目的原型。音频解决方案提供商 Remixd 集成在其平台中 Azure Neural TTS 的声音模型 Jenny 和 Davis,让客户在创建音频内容时有更多的选择。
关于 Azure Neural TTS
微软 Azure Neural TTS 是 Azure 开发人员可以使用认知服务中强大的语音合成功能 AI 技术将文本转化为逼真的声音。到目前为止,微软 Azure Neural TTS 支持全球 140 提供国家和地区的语言 400 声音模型可以加速声音的自动化生产,帮助各种企业更快地培养满足业务场景的声音,打造专属的声音品牌 —— 无论是呼叫中心、语音助手、有声书制作、聊天机器人、语音导购,还是影视剧 / 动画配音、自媒体短视频、情感电台、教育培训等场景。
持续的技术迭代和版本更新,让 Azure Neural TTS 它能为更多的企业和场景提供逼真、自然、脚踏实地的声音体验。同时,微软的所有技术进步都接受微软的责任 AI 流程指导遵循公平、包容、可靠、安全、透明、隐私、安全、负责任的原则,通过微软负责人工智能办公室 (ORA),人工智能、伦理与工程研究委员会 (Aether),以及负责任 AI 战略管理团队 (RAISE) 监督和实施这些道德标准。
- 十年磨剑,芯海PD快充芯片获得大订单!
- DxO连续第三年DxO PhotoLab获得最佳成像软件奖
- 意法半导体NanoEdge AI Studio支持智能传感器上设备端的学习和诊断
- 泛林集团阐述了实现净零排放的路径和进展
- 俄罗斯航天局首次公布了新空间站实体模型
- 穿越周期性调整 英特尔多措施布局半导体产业
- 芯片设计新时代:人工智能与 GPU 加速
- 荣耀赵明:Magic 四是全面对标苹果 目前还没有自研芯片的计划
- 物联网创新应用展望:成熟的工商市场促进物联网的增长
- Teledyne e2v四核外设丰富ARMCortex-A72宇航处理器为星载成像和人工智能提供了巨大的驱动力
- 价值突出,发展迅速:2021年中国智能决策解决方案市场份额研究发布
- 想要设计自己的晶片吗?Google Silicon计划帮你圆梦
