Inworld 推出全新 TTS-1.5:实时语音,延迟低,并支持多语言

laoluo
laoluo
laoluo
管理员
99
文章
0
粉丝
资讯评论5阅读模式

近日,人工智能公司 Inworld 正式发布了其最新的文本转语音模型 TTS-1.5。该模型以其自然、富有表现力的实时语音而备受关注,能够在低延迟的情况下提供多语言支持。

根据官方介绍,TTS-1.5的使用成本约为每分钟0.005美元,声称比市场上的同类产品便宜25倍,这一价格无疑将吸引大量用户的关注。

Inworld 推出全新 TTS-1.5:实时语音,延迟低,并支持多语言

 

TTS-1.5在技术上实现了低于250毫秒的实时延迟,这意味着用户可以在对话中几乎感觉不到任何延迟。语音合成技术的提升,不仅在速度上有了显著改善,模型在表达力和稳定性方面也进行了优化。这为各种应用场景,尤其是游戏和虚拟现实领域的对话系统提供了新的可能性。

除了极具竞争力的价格,用户对低延迟的需求也在不断上升。许多用户认为,延迟是文本转语音技术面临的一大挑战。如今,Inworld 的这一创新成果为实现更真实的对话体验铺平了道路。用户在社交平台上对这一技术表现出了浓厚的兴趣,并期待能在自己的项目中应用这一新模型。

重点:

TTS-1.5模型推出,具备自然的语音合成和多语言支持。

该模型每分钟费用约为0.005美元,比市场同类产品便宜25倍。

实现低于250毫秒的实时延迟,为用户提供更真实的对话体验。

 
laoluo
  • 本文由 laoluo 发表于2026年1月22日 14:41:44
  • 转载请务必保留本文链接:https://www.mydata-api.com/info/143.html
匿名

发表评论

匿名网友
确定

拖动滑块以完成验证