Empathic AI for voice and expression with emotional intelligence.
什么是Hume AI?
Hume AI 是一个具有共情能力的人工智能研究实验室,致力于构建具有情感智能的多模态人工智能。他们提供了先进的人工智能模型,如 Octave 文本转语音 (
TTS),这是首个能够理解上下文并预测情感的文本转语音大型语言模型,以及 Empathic Voice Interface (EVI),一个实时、可定制的语音智能模型,能够进行流畅、具有情感智能的对话。他们还提供表情测量 API,以便分析面部、声音和语言中的表情。他们的目标是创造具有表现力的人工智能声音和互动个性,重点关注人类福祉和伦理人工智能的发展。
如何使用 Hume AI?
用户可以通过提供文本提示,并描述所需的声音身份、特征和情感,使用 Octave TTS 生成 AI 声音。用户还可以使用 EVI 创建和交互实时合成声音和个性,实现灵活的提示和声调调节。开发者可以访问 API 和完整的开发者平台,将这些具有情感智能的语音代理集成到他们自己的应用程序中。
Hume AI 的核心功能
Octave 文本转语音 (TTS): 一种理解上下文、预测情感,并允许通过自然语言控制情感表现和说话风格的大型语言模型。
Octave 声音设计: 仅需简短提示或生动脚本即可创建任何 AI 声音。
Empathic Voice Interface (EVI): 实时、可定制的语音智能,用于各种应用,能够流畅对话,理解用户的语气并生成适当的语调。
表情测量 API: 测量面部、声音和语言中的表现。
对话性语音: 完整的开发者平台,用于部署具有情感智能的语音代理。
声音调制: 沿连续尺度调整 EVI 2 的基础声音(女性化、鼻音、音调)。
EVI 的新兴多语言能力。
Hume AI