microsoft为文本转语音 (tts) 应用程序推出了四种创新的 ai 神经语音,专为与 azure openai 服务集成而设计。这些语音已准备好增强基于语音的聊天机器人、语音助手和对话代理。
针对对话方案优化的语音
新引入的声音被命名为en-us-andrewneural,en-us-brianneural,en-us-emmaneuro(均为美国英语)和zh-ch-yunjieneuro(中文)。这些语音已针对对话上下文进行了微调,目前可在三个区域提供公共预览版:美国东部、东南亚和西欧。microsoft提供了这些语音的样本,突出了与现有的神经语音相比,它们在提供更自然和流畅的语音方面取得的进展。
“…友好,对生活持乐观态度,总是渴望帮助他人并分享有趣或实用的知识。说话的风格就像是和熟人喝茶的对话,保持着自然而不夸张的语气。microsoft的这句话强调了每个声音背后的角色和语气。
声音背后的技术进步
microsoft不断努力增强文本到语音转换(tts)建模技术,从而显著提高了ai语音的质量。最近的项目,如delightfultts 2和mulantts,弥合了ai语音和专业人类录音之间的质量差距。这些项目在制作听起来更自然、更逼真的声音方面发挥了关键作用。这种技术进步为新引入的人工智能语音奠定了基础。
开发人员可以使用 azure 语音 sdk 或 rest api 将这些语音无缝集成到其应用程序中。azure 机器人框架还提供了用于制作智能机器人的功能,这些机器人可以利用这些新的神经 tts 语音。
microsoft 广泛的产品包括 400 多种神经语音,涵盖 140 多种语言和区域设置。这个庞大的数组可确保开发人员和企业拥有大量选择,以为其用户提供丰富的对话体验。
未经允许不得转载:凯发k8国际真人 » microsoft 推出适用于 azure openai 的新 ai 文本到语音转换语音