导语:golang,通过prometheus获取物理cpu热区的温度
package collector
import (
"bytes"
"encoding/json"
"fmt"
"os/exec"
"strconv"
"strings"
"github.com/go-kit/log"
"github.com/prometheus/client_golang/prometheus"
"github.com/shirou/gopsutil/cpu"
)
const (
// 定义自定义数据指标的子系统名称
// 这里可能改成temp_metrics好点
tempMetricsSubsystem = "temp_metrics"
)
// 定义 tempMetricsCollector 结构体
type tempMetricsCollector struct {
logger log.Logger
//...
}
type TempStat struct {
CPU int32 `json:"cpu"`
// Temp float64 `json:"temp"`
PhysicalID string `json:"physicalId"`
}
func init() {
// 在该函数中调用 registerCollector() 函数,注册自定义 tempMetricsCollector
registerCollector("temp_metrics", defaultEnabled, NewTempMetricsCollector)
}
// 定义 tempMetricsCollector 的工厂函数,后续传入 registerCollector() 函数中,以便创建 tempMetricsCollector 对象
func NewTempMetricsCollector(logger log.Logger) (Collector, error) {
return &tempMetricsCollector{
logger: logger,
}, nil
}
// 实现 Update() 函数,以便在处理请求时被 Collector.Collect() 调用
func (c *tempMetricsCollector) Update(ch chan<- prometheus.Metric) error {
var metricType prometheus.ValueType
metricType = prometheus.CounterValue
m := make(map[string]float64)
infos, err := cpu.Info()
if err != nil {
return fmt.Errorf("couldn't get cpunfo: %s", err)
}
// 把切片里的有效数据放到map中
for _, info := range infos {
data, _ := json.MarshalIndent(info, "", " ")
var p InfoStat
err := json.Unmarshal(data, &p)
if err != nil {
fmt.Println("temp json err:", err)
}
// cpu_no := string(p.CPU)
// 获取cpu温度
//执行/sys/class/thermal/thermal_zone$cpu_id/temp 并输出返回文本
cmd_line1 := fmt.Sprintf("%s%d%s", "cat /sys/class/thermal/thermal_zone", p.CPU, "/temp")
cmd1 := exec.Command("sh", "-c", string(cmd_line1))
fmt.Println("cmd1 is ", cmd1)
// cmd1 := exec.Command("sh", "-c", "fuser -v ", req, " | grep '[0-9]*[1-9][0-9]'")
stdout1 := &bytes.Buffer{}
cmd1.Stdout = stdout1
cmd1.Run()
s2 := stdout1.String()
s2 = strings.Replace(s2, " ", "", -1)
s2 = strings.Replace(s2, "\n", "", -1)
// fmt.Println("s2", s2)
fmt.Printf("%#v\n", s2)
f1, err1 := strconv.ParseFloat(s2, 64)
if err1 != nil {
return fmt.Errorf("couldn't change s2 to f1: %s", err)
}
fmt.Println("f1", f1)
s1 := fmt.Sprintf("%s%d", "cpu_temp_", p.CPU)
m[s1] = f1
// m[s1] = f1 * 0.001
fmt.Println("temp map m:", m)
for k, v := range m {
// `prometheus.MustNewConstMetric()` 返回 `prometheus.constMetric` 对象,由描述信息,指标类型,指标值构成.如下指标
// # HELP go_info Information about the Go environment.
// # TYPE go_info gauge
// go_info{version="go1.14.4"} 1
ch <- prometheus.MustNewConstMetric(
prometheus.NewDesc(
// 描述信息包括 数据指标名称(由 `BuildFQName()`函数组合而成),帮助信息,变量标签,常量标签
prometheus.BuildFQName(namespace, tempMetricsSubsystem, k),
fmt.Sprintf("Temp metrics field cpu temp %s.", k),
nil, nil,
),
// 返回v为float64类型
metricType, v,
)
}
}
return nil
}
结果看情况是通过grafana处理还是在代码里直接*0.01
CPU 温度(最热的核心)由 x86_pkg_temp 给出。
$ cat /sys/class/thermal/thermal_zone10/type
x86_pkg_temp
然后/sys/class/thermal/thermal_zone10/temp
是应该在 i3 状态栏中使用的文件。
附带说明一下,每个内核的温度都可以temp*_input
在/sys/devices/platform/coretemp.0/hwmon/hwmon*/
. 关联temp*_label
显示哪个文件与哪个内核相关(在我的例子中是 4 个内核):
.../hwmon*/$ grep "" temp*_label
temp1_label:Physical id 0
temp2_label:Core 0
temp3_label:Core 1
temp4_label:Core 2
temp5_label:Core 3
该文件temp1_input
对应于内核的最热值。
如果要获取对应每个cpu的温度 需要
cat /sys/devices/platform/coretemp.0/hwmon/hwmon2/temp1_input
参考
https://qa.1r1g.cn/unix/ask/21339181/
https://cloud.tencent.com/developer/article/1820706