Inworld 推出全新 TTS-1.5：实时语音，延迟低，并支持多语言

2026年1月22日 14:41:44laoluo

laoluo

管理员

99
文章

0
粉丝

资讯评论5阅读模式

近日，人工智能公司 Inworld 正式发布了其最新的文本转语音模型 TTS-1.5。该模型以其自然、富有表现力的实时语音而备受关注，能够在低延迟的情况下提供多语言支持。

根据官方介绍，TTS-1.5的使用成本约为每分钟0.005美元，声称比市场上的同类产品便宜25倍，这一价格无疑将吸引大量用户的关注。

TTS-1.5在技术上实现了低于250毫秒的实时延迟，这意味着用户可以在对话中几乎感觉不到任何延迟。语音合成技术的提升，不仅在速度上有了显著改善，模型在表达力和稳定性方面也进行了优化。这为各种应用场景，尤其是游戏和虚拟现实领域的对话系统提供了新的可能性。

除了极具竞争力的价格，用户对低延迟的需求也在不断上升。许多用户认为，延迟是文本转语音技术面临的一大挑战。如今，Inworld 的这一创新成果为实现更真实的对话体验铺平了道路。用户在社交平台上对这一技术表现出了浓厚的兴趣，并期待能在自己的项目中应用这一新模型。

重点:

TTS-1.5模型推出，具备自然的语音合成和多语言支持。

该模型每分钟费用约为0.005美元，比市场同类产品便宜25倍。

实现低于250毫秒的实时延迟，为用户提供更真实的对话体验。