开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人 - 悦读

开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人

项目地址

https://github.com/lukeewin/AudioSeparationGUI

运行环境

任意 PC 端
python version >= 3.8

安装

如果使用 GPU 来运行，需要安装好 CUDA
安装 ffmpeg，可以到 ffmpeg 官方地址中下载可执行程序，配置环境变量
按依赖

pip install -U funasr modelscop ffmpeg-python

安装 torch，需要根据你电脑情况安装不同的版本，具体可以到 torch 中复制命令安装

运行

python app.py

效果

本地可运行的说话人拆分 | 说话人分离

其它

这个程序适合个人 PC 端使用，如果需要服务端接口，支持多路并发，支持大规模集群部署，欢迎联系我。
个人技术博客1：https://lukeewin.top
个人技术博客2：https://blog.lukeewin.top

悦读

道可道，非常道；名可名，非常名。无名，天地之始，有名，万物之母。故常无欲，以观其妙，常有欲，以观其徼。此两者，同出而异名，同谓之玄，玄之又玄，众妙之门。

接上文AI电销机器人-智能AI机器人源码，电话机器人源码和系统部署运行环境freeswitch

支付宝沙箱钱包的下载与登录

uniapp中使用pinia，并做数据持久化

[DL021]Pytorch使用GRU实现姓名-国籍分类-刘洪普B站课程代码

C++STL面试题笔记 01 vector、list

switch注意事项与在什么情况下使用switch或if语句

【Linux：生产消费模型】

2024年最佳AI大模型-LLM排名（非常详细）零基础入门到精通，收藏这一篇就够了

;