dim=-1表示在最后一个维度(大概率是一行)应用Softmax函数,将值标准化为概率分布。
实例
假设我们有一个张量X,形状为(2,3),内容如下:
import torch
import torch.nn.functional as F
X = torch.tensor([[1.0, 2.0, 3.0],
[1.0, 2.0, 3.0]])
# 计算 Softmax
softmax_result = F.softmax(X, dim=-1)
print(softmax_result)
输出:
tensor([[0.0900, 0.2447, 0.6652],
[0.0900, 0.2447, 0.6652]])
可以看到,每一行的输出值加起来为 1,这表示已经进行了Softmax操作。