文章目录
🌹 python 如何提取视频/音频中的文字
最近在观看学习视频,做笔记时遇到一个痛点,需要反复一段一段的去看视频,再手敲整理笔记 😠 。想着有没有可以免费的转换工具或者软件,就去网上搜了一下,发现大多数软件都会限定视频时长,超出收费。
本意白嫖,收费就太见外了。几经周转,了解到讯飞语音有语音解析的功能,在 讯飞开发平台中找到了语音转文字的接口,关键免费。
梳理一下需求:
- 讯飞认证
- 视频转换为音频
- 利用讯飞接口提取音频文字
- 结果保存到本地
🍀 讯飞认证
- 注册用户
进入 讯飞开发平台主页,注册登录后。点击语音转写。
-
领取时长
领取免费时长,期限一年(企业50小时、个人5小时)
5小时不够用的话可换个账号。
-
创建应用
创建应用后会得到APPID和密钥
该 id 和密钥在接口代码中需要使用
准备就绪…
🍀 视频转换为音频
采用python中moviepy.editor包中的AudioFileClip类,将视频文件转换为音频文件。
from moviepy.editor import AudioFileClip
dataMovieMp4 = AudioFileClip(r"*****.mp4")
dataMovieMp4.write_audiofile(r"*****.mp3")
🍀 利用讯飞接口提取音频文字
- 下载接口 demo 代码
- 替换代码中的 APPID、密钥
api = RequestApi(appid="xxxxx", secret_key="xxx", upload_file_path=r"xxxxx.mp3")
-
自定义结果解析
# 自定义解析函数 data_str = api.analysis_json_lattice2(data_voice_to_str_result)
🍀文字保存到本地
-
存到本地txt
# 数据存储到本地 with open(r"xxxxx\CDP.txt", 'w') as f: f.write(data_str)
目前还有免费时长,可帮忙转换哦!
需帮转换或者需要详细解析代码请关注公众号:小甘技术栈