Whisper是 OpenAI旗下的开源语音识别系统,可以将人类的语音指令转换成计算机可识别的文本形式,从而实现语音输入。简单来说Whisper支持将语音转换为文字,支持多种语言,尤其是在英语语音识别方面的稳健性和准确性接近人类水平,Whisper可以在不同的平台和设备上运行。今天给大家介绍一款基于OpenAI API的开源Whisper 客户端「Transcribe Audio」,可以直接运行在本地电脑也可以运行在主机上。
[t-danger icon='']Transcribe Audio[/t-danger]
Transcribe Audio是一个非常简易的开源Whisper 客户端,它只有三个文件:index.html、index.js、style.css,只需要下载、解压缩,将 index.html 拖到浏览器里就可以使用,也可以将这些文件上传到主机空间绑定域名进行访问。在顶部输入你的 OpenAI API key(和 ChatGPT 同一个),就可以选择音频文件进行转换,支持保存为文本、.srt、.vtt 三种格式。
支持上传音频格式:mp3、mp4、mpeg、mpga、m4a、wav、webm、mp4、mpeg、webm
开源地址:https://github.com/felixbade/transcribe
官方DEMO:https://transcribe.bloat.app
API 价格
- Whisper API 价格为 $0.006 / 分钟