Bootstrap

阿里 FunAudioLLM:增强人类和 AI 用自然语音交互

 是阿里通义团队发布的用于增强人和 LLMS 语音交流的框架,包含了:

  • SenseVoice:支持 50 多种语音和情感识别的语音识别
  • CosyVoice:支持多语言、跨语言、语音克隆,自然情感语音生成

都在 modelscope 上有免费试用,FunAudioLLM 能够轻松与 LLMS 集成,能实现语音翻译、情感语音聊天、交互式播客和有声读物等。

整体效果比起之前字节的 Seed-TTS 略差,不过强在开源了,并且现在你就可以直接用了!

;