Whisper GitHub

12个月前发布 1.7K 0 0

由OpenAI开发的通用语音识别模型。

收录时间：

2025-07-02

打开网站 >>火爆全球！立即体验最好用的AI生图工具

ai-语音生成与转换新出AI

Whisper GitHub

打开网站

A general-purpose speech recognition model by OpenAI.

什么是Whisper？

Whisper是由OpenAI开发的一款通用语音识别模型。它训练于一个大型的多样化音频数据集，并且是一种多任务模型，可以执行多语言语音识别、语音翻译和语言识别。Whisper采用了Transformer序列到序列模型，训练于各种语音处理任务，包括多语言语音识别、语音翻译、口语语言识别和语音活动检测。这些任务被作为一串由解码器预测的标记共同表示，使得单一模型能够取代传统语音处理流程中的多个阶段。多任务训练格式使用了一组特殊标记，作为任务说明符或分类目标。

如何使用 Whisper？

Whisper可以通过命令行或在Python中使用。对于命令行使用，你可以通过指定音频文件和模型大小来转录音频。对于Python使用，你可以加载模型并使用transcribe()方法来处理音频文件。

Whisper 的核心功能

多语言语音识别
语音翻译
语言识别
语音活动检测

Whisper GitHub相关导航

Whisper GitHub 暂无评论

暂无评论...

Whisper GitHub

由OpenAI开发的通用语音识别模型。

什么是Whisper？

如何使用 Whisper？

Whisper 的核心功能

Whisper GitHub相关导航

EOSI Finance

Kahaani – AI Powered Book reader

MealForMe

Sensey AI

Welcome Compass

Tendi AI

Magical AI

Forever Voices: Companion

Whisper GitHub 暂无评论

排行榜

DeepSeek满血版

当贝AI

OpenClaw中文版

DeepSeek

纳米AI

热门资料