Speech-to-Text API for transcription, translation, and audio intelligence.
什么是Gladia?
Gladia 提供一个语音转文本 API,支持通过
AI 转录、翻译和音频智能附加功能来增强产品。它基于增强版 Whisper ASR,为将无结构的音频数据转化为有价值的商业知识提供快速、准确和可扩展的解决方案。Gladia 的 API 支持转录、翻译到 99 种语言和音频分析,确保数据安全和 GDPR 合规。服务涵盖多个行业,包括内容和媒体、虚拟会议、工作空间协作和呼叫中心。
如何使用 Gladia?
要使用 Gladia,开发者可以使用 TypeScript、Javascript 和 Python 提供的代码片段将 API 集成到他们的应用程序中。API 需要 API 密钥进行身份验证,并可通过 URL 或直接上传音频数据。然后 API 根据所选功能返回转录的文本、翻译或分析结果。
Gladia 的核心功能
语音转文本转录
支持翻译到 99 种语言
音频智能附加功能(字级时间戳、摘要)
说话者分离
支持语言切换
自动语言检测
自定义词汇表
Gladia