WWW23顶会
很幸运能在WWW23中稿两篇论文,作为22年中旬才开始做深度学习方面的科研新手来说,给即将入门科研的人一些我总结的经验和技巧
主要分成这几点来介绍:
- 科研前的选题
- 科研中的耐心
- 科研后的延续
- 总结
- 工作简介
科研前
作为一个深度学习的小白, 我之前科研的主要方向是矩阵优化和统计优化,后面因为一些原因转到图神经网络的组里。主要是做深度学习和数据挖掘。这时候,我们需要思考自己的优势,我们不像计算机可续班的同学那样,各种代码框架新手拈来。代码的实现轻而易举。我们有的是一些虚无缥缈的数学功底。
在阅读图神经网络的各种相关文献的时候,发现文章一般有两种风格,一个是解决问题的“技术报告”,另一种是理论丰富但是实现起来较为容易的。我作为数学系的学生自然就选择了后者 (因为不会写代码5555)。确定了论文风格之后,再加上同期还在参与一个图谱理论的讨论班,所以就开始着重阅读一些偏理论的图谱网络的文章。
文献积累够了之后,我们就需要思考整个领域的缺陷和可能可以发展的地方。也就是常说的ideas,我认为文章大概又能分为以下几种,一种是占坑类型(A+B),一种是开创类型的,一种是深挖类型的,而我当然就是选择从A+B中进行深挖,往往最好下手(要从科研质疑的角度看待每一篇论文,而不是学习
科研中
确定了科研题目之后,就会遇到证明猜想和代码实验的困难。对于我的选题,代码的部分往往并不困难(难的我也不会写呀5555),所以我只有一些对数学证明的感触。每篇文章我往往都会写一到两个小定理或者性质命题,我们需要对我们新的设定做一些简单的假设,然后在一些特殊情况下,构建起对于整个模型的认识,然后根据一些参考文献,给出我们的猜想的命题,比如收敛,收敛性,鲁棒性…证明的方法虽然大相径庭,但一般都是关于矩阵论和随机过程的东西,强相关的参考文献中的证明过程一定要仔细过一遍,因为往往能学到这个领域的“套路”。
对于代码实验,处理将自己的想法实现出来,我也有一些小小的心得,那就是要和作者一起把代码 r e v i e w review review一遍,遇到效果不佳或者提升并不明显的时候,不要轻易放弃,不一定是你的idead不可行,可能是框架的一些别的模块和我们的方法不匹配,这就需要经验的积累了,也是科研经验很重要的一部分。
科研后
很多人会好奇科研后是什么意思,其实就是如果对这个领域进行进一步的深挖,甚至是在这个课题做完之后如何进行更多的改进。这个一般在论文收尾或者修改论文的时候思考。我往往会在大规模跑实验和写论文的时候,阅读一些其他小领域的文章,粗略的了解一些不曾触及的知识,这对于idea的迸发和科研的推进应该是非常有用的。
总结
关于2022年整个科研过程,我觉得有几点非常重要:
(1)打好数学基础,不要贪图看论文的数量,看一篇就要看懂一篇;(2)多和伙伴交流,这真的很重要很重要,多听听别人的建议和想法会让你受益匪浅,也会脑洞大开hhh;(3)不要局限自己的领域,不要功利性的看一些论文,对于和自己科研方向看起来无关的知识也可以适当的了解;(4)除了论文的理论和结果,论文的写作也是非常重要的,往往一篇文章修改的时间甚至比写作还长,需要耐心理清楚逻辑让审稿人和读者明白你的意图
经验
从科研质疑的角度看待每一篇文章
在大规模跑实验和阅读论文的时候,阅读一些其他小领域的文章,粗略了解一些不曾触及的知识。
————$ideass$的迸发和科研的推进是非常有用哒。