Bootstrap

python 如何将视频文件的语音转换为文字

🌹 python 如何提取视频/音频中的文字

最近在观看学习视频,做笔记时遇到一个痛点,需要反复一段一段的去看视频,再手敲整理笔记 😠 。想着有没有可以免费的转换工具或者软件,就去网上搜了一下,发现大多数软件都会限定视频时长,超出收费。

本意白嫖,收费就太见外了。几经周转,了解到讯飞语音有语音解析的功能,在 讯飞开发平台中找到了语音转文字的接口,关键免费。

在这里插入图片描述
梳理一下需求:

  • 讯飞认证
  • 视频转换为音频
  • 利用讯飞接口提取音频文字
  • 结果保存到本地

🍀 讯飞认证

在这里插入图片描述

  • 领取时长

    领取免费时长,期限一年(企业50小时、个人5小时)
    5小时不够用的话可换个账号。

在这里插入图片描述

  • 创建应用

    创建应用后会得到APPID和密钥
    该 id 和密钥在接口代码中需要使用

在这里插入图片描述

在这里插入图片描述
准备就绪…

🍀 视频转换为音频

采用python中moviepy.editor包中的AudioFileClip类,将视频文件转换为音频文件。

from moviepy.editor import AudioFileClip
dataMovieMp4 = AudioFileClip(r"*****.mp4")
dataMovieMp4.write_audiofile(r"*****.mp3")

在这里插入图片描述

🍀 利用讯飞接口提取音频文字

  • 替换代码中的 APPID、密钥
    api = RequestApi(appid="xxxxx", secret_key="xxx", upload_file_path=r"xxxxx.mp3")
    

在这里插入图片描述

  • 自定义结果解析

    # 自定义解析函数
    data_str = api.analysis_json_lattice2(data_voice_to_str_result)
    

🍀文字保存到本地

  • 存到本地txt

    # 数据存储到本地
    with open(r"xxxxx\CDP.txt", 'w') as f:
    	f.write(data_str)
    

在这里插入图片描述


目前还有免费时长,可帮忙转换哦!
需帮转换或者需要详细解析代码请关注公众号:小甘技术栈

在这里插入图片描述

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;