Conversational text-to-speech model for natural, expressive dialogue.
什么是ChatTTS?
ChatTTS是一种尖端的对话文本转语音(TTS)模型,专为聊天机器人和虚拟助手等对话场景设计。它将文本转换为动态、自然的语音,支持英语和中文。该模型经过超过10万小时的广泛数据训练(完整版本为10万小时,开源版本为4万小时),以提供富有表现力的语音,并对诸如笑声、停顿和插入语等韵律特征进行细致控制。
如何使用 ChatTTS?
使用ChatTTS时,用户需在提供的界面中输入文本。然后,他们可以优化文本并调整音频温度、top_P、top_K、音频种子和文本种子等参数,然后生成输出音频。
ChatTTS 的核心功能
针对对话场景进行优化(对话TTS)
对韵律特征(如笑声、停顿、插入语)进行精细控制
在韵律上优于大多数开源TTS模型
支持英语和中文
经过大量数据训练,生成自然、富有表现力的语音
ChatTTS Me – AI text to speech