Whisper离线部署问题处理 - 悦读

Whisper离线部署问题处理

Whisper是OpenAI开发一款开源语音识别模型，可以帮我们低成本的拥有语音识别的能力。具体的安装部署方法，我在这里就不详细说了，网上有很多相关文章：

使用OpenAI的Whisper 模型进行语音识别 (baidu.com)

我这里主要想说的是，如果你想离线部署Whisper模型，除了安装python依赖环境以外，还需要安装ffmpeg用于语音文件读取，Linux上的安装方法为：

sudo apt-get install ffmpeg

此外，离线部署还依赖模型文件，这个文件的缓存目录是：

~/.cache/whisper

最后，whisper还依赖了gpt-2的词表，

主要依赖

https://openaipublic.blob.core.windows.net/gpt-2/encodings/main/vocab.bpe

和

https://openaipublic.blob.core.windows.net/gpt-2/encodings/main/encoder.json

这两个文件。

缓存目录我找了半天，最后终于找到它的位置在

/tmp/data-gym-cache

只要把这几个缓存文件，拷贝到离线服务器的对应位置上，就可以愉快的离线使用whisper啦！

悦读

道可道，非常道；名可名，非常名。无名，天地之始，有名，万物之母。故常无欲，以观其妙，常有欲，以观其徼。此两者，同出而异名，同谓之玄，玄之又玄，众妙之门。

基于YOLO V8的PCB缺陷检测识别系统（python源码+Pyqt5界面+数据集+训练代码）

【设计模式-观察者模式】

字节跳动内网开源的《Python项目开发实战》，GitHub飙升！

蓝桥杯试题基础练习序列求和（Python）

JavaEE进阶（5）Spring IoC&DI：入门、IoC介绍、IoC详解（两种主要IoC容器实现、IoC和DI对对象的管理、Bean存储、方法注解 @Bean)、DI详解：注入方式、总结

Sqlmap中文使用手册 - Injection模块参数使用

史上最强C语言教程----分支和循环（1）

在 Linux 上分析二进制文件的 10 种方法

使用rollup函数统计报表合计

在python中逐行读取大文件

;