Bootstrap

关于曙光&宁畅&中科可控AMD EPYC平台服务器CPU核心数识别不全问题的处理建议

一、问题描述

CPU型号:AMD EPYC 9754 ;BMC和OS下识别只有48-core,实际为128-Core。

1

1

2

2

二、排查过程

1、查询生产老化记录,CPU核心数识别正常,怀疑跟现场BIOS配置相关。

3

3

2、现场导出BIOS配置查询未发现配置明显异常,尝试F3调用最优配置后CPU核心识别正常。重新导出BIOS配置比对,发现区别点在于IOMMU,识别正常为enabled,识别异常为disabled。

三、解决方案和建议

1、开启IOMMU可解决CPU核心数识别不全的问题;

2、CPU核心数超过64,不建议关闭IOMMU,会降核心;

3、之前AMD的CPU架构在不关闭IOMMU的情况下,某些应用确实可能出现异常,但是从AMD Genoa架构开始已无需再关闭IOMMU;

4、如果一定要关闭IOMMU,建议通过OS下将iommu=pt写到grub的方式来关闭。

;