Bootstrap

pytorch模型训练的若干问题

1、Net(input)调用的是什么函数?为什么直接写对象名就直接调用函数了?
net是创建的vgg类的对象,vgg类继承于pytorch库中类nn.Module。创建类时的括号里写上父类的名字,就是继承的意思。
在这里插入图片描述
在pytorch库中nn.Module定义如下:

在这里插入图片描述
在这里插入图片描述
forward : Callable[…, Any] = _unimplemented_forward ,call : Callable[…, Any] = _call_impl
这个冒号意思基本类似于forword函数就是 _unimplemented_forward,只是输入输出都是任意的。
call 就是_call_impl输入输出都是任意的。
源码可以简化为下面的函数:
在这里插入图片描述
当子类调用c1(),__call__调用_call_impl(*args),再调用self.forwords,如果子类有forward,那就调用子类的forword,如果子类没有forword,就调用父类的forward,就是_unimplemented_forward,直接报错。

当父类和子类调用同一个函数名 F,子类的对象调用的是子类的F函数。

2、net.train()函数从何而来?
都是父类的nn.Module的函数,由net继承。 net.eval()、net.load_state_dict()都是父类的函数
3、net.eval()有啥用?
如果不写net.eval(),每次模型测试的概率值都不一样。
4、@torch.no_grad() 有啥用?为啥要卸载测试函数前面?
@这样写,就是装饰器,测试函数不算梯度,是为了节省空间。python的装饰器,写在一个函数前面,就是说在执行这个函数的时候,就会执行装饰器里的内容。
其他的重点内容,看下面两篇文章。
《浅谈 PyTorch 中的 tensor 及使用》https://zhuanlan.zhihu.com/p/69294347
《PyTorch 的 Autograd》https://zhuanlan.zhihu.com/p/67184419

;