python 如何将视频文件的语音转换为文字

🌹 python 如何提取视频/音频中的文字

最近在观看学习视频，做笔记时遇到一个痛点，需要反复一段一段的去看视频，再手敲整理笔记 😠 。想着有没有可以免费的转换工具或者软件，就去网上搜了一下，发现大多数软件都会限定视频时长，超出收费。

本意白嫖，收费就太见外了。几经周转，了解到讯飞语音有语音解析的功能，在讯飞开发平台中找到了语音转文字的接口，关键免费。

在这里插入图片描述
梳理一下需求：

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
准备就绪…

采用python中moviepy.editor包中的AudioFileClip类，将视频文件转换为音频文件。

from moviepy.editor import AudioFileClip
dataMovieMp4 = AudioFileClip(r"*****.mp4")
dataMovieMp4.write_audiofile(r"*****.mp3")

在这里插入图片描述

替换代码中的 APPID、密钥

api = RequestApi(appid="xxxxx", secret_key="xxx", upload_file_path=r"xxxxx.mp3")

在这里插入图片描述

自定义结果解析

# 自定义解析函数
data_str = api.analysis_json_lattice2(data_voice_to_str_result)

存到本地txt

# 数据存储到本地
with open(r"xxxxx\CDP.txt", 'w') as f:
	f.write(data_str)

在这里插入图片描述

目前还有免费时长，可帮忙转换哦！
需帮转换或者需要详细解析代码请关注公众号：小甘技术栈

在这里插入图片描述