AI·新世界

开源Whisper 客户端「Transcribe Audio」，基于 OpenAI API 进行语音转文字

2023年5月23日

/

文章目录[隐藏]

[t-danger icon='']Transcribe Audio[/t-danger]

Whisper是 OpenAI旗下的开源语音识别系统，可以将人类的语音指令转换成计算机可识别的文本形式，从而实现语音输入。简单来说Whisper支持将语音转换为文字，支持多种语言，尤其是在英语语音识别方面的稳健性和准确性接近人类水平，Whisper可以在不同的平台和设备上运行。今天给大家介绍一款基于OpenAI API的开源Whisper 客户端「Transcribe Audio」，可以直接运行在本地电脑也可以运行在主机上。

[t-danger icon='']Transcribe Audio[/t-danger]

Transcribe Audio是一个非常简易的开源Whisper 客户端，它只有三个文件：index.html、index.js、style.css，只需要下载、解压缩，将 index.html 拖到浏览器里就可以使用，也可以将这些文件上传到主机空间绑定域名进行访问。在顶部输入你的 OpenAI API key（和 ChatGPT 同一个），就可以选择音频文件进行转换，支持保存为文本、.srt、.vtt 三种格式。

支持上传音频格式：mp3、mp4、mpeg、mpga、m4a、wav、webm、mp4、mpeg、webm

开源地址：https://github.com/felixbade/transcribe

官方DEMO：https://transcribe.bloat.app

API 价格

Whisper API 价格为 $0.006 / 分钟

相关文章

我们将24小时内回复。