ChatTTS is a voice generation model for conversational scenarios in Chinese and English.
什么是ChatTTS?
ChatTTS是一个针对对话场景设计的语音生成模型。它非常适合用于大型语言模型助手的对话任务,以及对话类音频和视频介绍。该模型支持中文和英文,在语音合成方面展现出高质量和自然性。这种高水平的表现是通过大约100,000小时的中文和英文数据训练而成。项目团队计划将一个用40,000小时数据训练的基础模型开源,以帮助学术和开发社区进行进一步的研究和开发。
如何使用 ChatTTS?
要使用ChatTTS,请从GitHub下载代码,安装必要的依赖(torch和ChatTTS),导入所需的库,初始化ChatTTS,准备文本,使用infer方法生成语音,并通过IPython.display中的Audio类播放生成的音频。
ChatTTS 的核心功能
多语言支持(英语和中文)
高质量和自然听感的语音合成
与大型语言模型助手的对话任务兼容
开源计划提供训练好的基础模型
ChatTTS