首发！ZStack 智塔支持 DeepSeek V3/R1/ Janus Pro，多种国产 CPU/GPU 可私有化部署

2025年2月2日，针对日益强劲的AI推理需求和企业级AI应用私有化部署场景（Private AI），云轴科技 ZStack 宣布 AI Infra 平台 ZStack 智塔全面支持企业私有化部署 DeepSeek V3/R1/ Janus Pro三种模型，并可基于海光、昇腾、英伟达、英特尔等多种国内外 CPU/GPU 适配，助力企业级 AI 应用进一步落地。

云轴科技ZStack智塔功能架构图

据悉，随着DeepSeek于2024年12月上线并开源 DeepSeek V3/ R1/Janus Pro，全球公有云平台如 AWS、Azure、华为云陆续宣布支持 DeepSeek R1或R1/V3。ZStack 智塔作为支持 DeepSeek 的企业级私有化 AI Infra 平台，将充分发挥 DeepSeek 开源模型和低成本高性能特点，进一步推进AI的企业级商用进程：

全面支持 DeepSeek 三种模型，满足企业不同AI场景需求

AI Infra 平台 ZStack 智塔在模型层提供模型开发和应用所需的各种基础工具和组件，支持各种开源闭源AI模型的生命周期管理。ZStack 智塔首发支持 DeepSeek V3/ R1/Janus Pro，V3 适用于通用型自然语言处理任务，R1 专注于复杂推理任务，而 Janus Pro 则擅长多模态理解与生成，可满足企业不同 AI 场景的需求。

支持国产/国外多种 CPU/GPU，适配企业数据中心多样化算力资源

AI Infra 平台 ZStack 智塔在算力层提供计算、存储、网络、安全等基础资源和服务，可支持 DeepSeek 在海光、昇腾、英伟达、英特尔等多种国内外 CPU/GPU 算力资源上进行私有化部署，适配企业数据中心多样化算力资源。

ZStack 智塔具备智能异构调度引擎自动匹配硬件特性，支持 CUDA、ROCm、CANN 等体系架构，以及无 GPU 测试方案，CPU 部署 DeepSeek-R1-7B 轻量化模型，在 16 核云主机实现 9.26 tokens/s可用级表现。

提供企业灵活性与定制化服务，构建新一代企业数智化平台

AI Infra 平台 ZStack 智塔可以根据企业自身需求，在私有云或混合云环境中部署DeepSeek模型，从而确保数据的安全性和隐私保护；还提供裸金属、虚拟机和容器计算资源的弹性扩展，支持与多种硬件和软件的集成，使得企业能够轻松地将AI能力整合到现有系统中，这种灵活性和定制化服务满足了企业级用户对AI应用的多样化需求。

ZStack 智塔在资源利用方面具备可多卡并发推理技术，通过多张 GPU 联合推理，提升小显存 GPU 可用性，减少闲置；显卡切分技术，通过对单张 GPU 进行算力、显存切分，提升大显存 GPU 的资源利用率；模型量化技术，模型平台可以对模型进行量化，配合 DeepSeek 低成本高性能特点大幅提升 AI 效率。

AI Infra 平台是企业加速释放AI生产力的关键引擎平台，它聚焦企业级AI应用的私有化部署场景（Private AI），是支撑人工智能应用开发、部署、运行和管理的一系列基础工具和软件平台，具备算力管理层、模型管理层、应用管理层三大能力模型。赛迪顾问认为，2025年是中国 AI Infra 平台应用元年。

AI 推理算力需求激增，催生了企业级智算资源管理新需求；AI 应用加速向企业级场景渗透，模型工具链、运营管理组件助力降低 AI 应用门槛；数据隐私和安全性驱动AI应用的私有化部署，新一代企业数智化转型底座 AI Infra 平台呈现飞速发展趋势。2025年1月，赛迪顾问发布《2025中国 AI Infra 平台市场发展研究报告》中预计，AI Infra 平台2024年、2025年将分别达到19.4亿元和36.1亿元，2025年同比增长将超过86%。

首发！ZStack 智塔支持 DeepSeek V3/R1/ Janus Pro，多种国产 CPU/GPU 可私有化部署

悦读