免费强大快速的语音转文本工具openai的whisper+google的colaboratory
使用这个是因为卡在了剪映的智能字幕上面99%,一直动不了,尝试多次失败,之前用capcut可以处理,现在依旧失败,所以用以下语音转文字的作为临时替代方案,没想到无论准确度和格式都比剪映要好,最下面可以预览。
语音转文本使用条件:
一个google账号即可
运行代码,克隆githubwhisper项目,安装ffmpeg环境
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
处理文件的命令
!whisper "文件名.mp3" --model medium
语音识别后,翻译为英文的命令
!whisper "文件名.mp3" --model medium --task translate
使用最新的Whisper v3模型
!whisper "文件名.mp3" --model large-v3
100%|█████████████████████████████████████| 1.42G/1.42G [00:24<00:00, 63.5MiB/s]
Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:10.000] 哈喽,大家好,欢迎来到520解说,这期节目我给大家介绍免费搭建自己的ChatGPT网页版。
[00:10.000 --> 00:20.000] 国内也可以证证访问,再也不用担心访问不了ChatGPT了,也不用担心账号被封。
[00:20.000 --> 00:29.000] 那么搭建ChatGPT网页版分为以下四步。
[00:29.000 --> 00:36.000] 第一步,注册ChatGPT的账号,获取OpenAI的API Key。
[00:36.000 --> 00:42.000] 之前我讲过一个教程,注册ChatGPT。
[00:42.000 --> 00:51.000] 现在已经是,最近已经是不需要手机号就可以注册了。
[00:51.000 --> 01:00.000] 你只要IP满足它的条件就OK。
[01:00.000 --> 01:07.000] 那么等一下,那么等一下我们再去获取OpenAI的API Key。
[01:07.000 --> 01:16.000] 第二步,注册Github账号,我们打开这个网址,来到Github的页面。
[01:16.000 --> 01:27.000] 在这里,在这里输入一个邮箱,最好是国外的邮箱,能够接应着码。
[01:27.000 --> 01:45.000] 因为国外的邮箱和国内的邮箱注册的账号,权限有些不同。
[01:45.000 --> 02:14.000] 输入了邮箱之后,点击Sign Up。
评论
发表评论