1、为什么要写这篇blog
因为最近在使用pytorch复现关于图像处理的深度学习论文时,需要求4维张量与4维张量(Batch,Channel,sizeA,sizeB)的余弦相似度和欧氏距离。
余弦相似度比较好解决,网上对于多维tensors的欧式距离求解就让人一言难尽了,直接使用torch.pairwise_distance根本解决不了问题,为此,我写下这篇blog,让自己好好梳理一遍原理,也希望能帮到和我遇到一样问题的小伙伴们。
2、函数介绍
以下,我将使用python中的pytorch框架进行讲解和展示。
(1)余弦相似度:torch.cosine_similarity
(2)欧氏距离:对输入数据进行改写,迎合torch.pairwise_distance函数的实现。
3、结果(代码)实现
3.1、余弦相似度
这是我在了解torch.cosine_similarity函数时使用的示例,输入的维度是[1,3,2,2],输出维度是[1,2,2]。
input1 = torch.tensor([[[[1, 2], [3, 4]],
[[1, 2], [3, 4]],
[[5, 6], [7, 8]]]], dtype=torch.float)
print(input1.shape)
input2 = torch.tensor([[[[5, 6], [7, 8]],
[[5, 6], [7, 8]],
[[1, 2], [3, 4]]]], dtype=torch.float)
output = torch.cosine_similarity(input1, input2)
print(output)
print(torch.cosine_similarity(torch.tensor([1,1,5], dtype=torch.float),\
torch.tensor([5,5,1], dtype=torch.float),dim=0))
最后一行代码就是其输出的原理(应该很好理解),结果展示:
3.2、欧氏距离
这是我在了解torch.pairwise_distance函数时使用的示例,输入的维度是[2,2,3,4],输出维度是[2,3,4],少了的维度(2)是channel所在的维度。
a = torch.randint(1,8,(2,2,3,4))
# print(a)
a = a.transpose(1,3)
print(a.shape)
# print(a)
b = torch.randint(1,4,(2,2,3,4))
# print(b)
b = b.transpose(1,3)
# print(b)
c = torch.pairwise_distance(a,b)
# print(c)
print(c.shape)
c = c.transpose(1,2)
# print(c)
print(c.shape)
因为torch.pairwise_distance函数,会对最后一维进行展开,所以应该先把张量维度重构为(Batch,sizeA(B),sizeB(A),Channel),再进行计算即可。维度展示如下所示,
4、结语
要先理解其中机理才能更好地实现自己的需求啊,兄弟们,不能一味地直接调用函数呢!