Bootstrap

关于做研究的方法论篇

0. 从问自己【为什么】开始

做研究的第一步是选择一个新的领域进入,那么,好好问问自己为什么要进入这个领域很重要,它可以是热爱,也可以是恐惧。

那么,我对人工智能中的NLP领域算的上是热爱,并且符合学院的大方向政策,在这个问题上,对于我应该是已经解决的问题了。

1. 提纲挈领,掌握全貌

这一步很重要。上来就扎到细节里并不是一件好事 —— 这就跟画画一样,你先从左上到右下进行构图,把大的形状勾勒出来,然后对此不断递归,直到想要的细节被雕琢出来。

其中所使用的方法可以是脑图、层次结构图等。

2. 不断递归,不断提问

在完成了所要研究领域的大的框架图之后,在每一个小的部分里还可以拓展出另一个大的框架,我们要不断迭代,尽量完善整个框架图的细节

在此期间,我们要问自己很多问题,这里有一些必问的问题(不断更新中):

  • 为什么需要这个技术?它解决什么已知的问题?
  • 它涉及到哪些内容?(下一步再递归)
  • 整个技术发展的历史是什么样子?(了解历史是看见未来的重要途径)
  • 如果有多个 solutions,每个 solution 的优缺点是什么?(指出现有方法的弊端,找到痛点是提出idea的关键之一)
  • 给我一页白纸,我能否画出这个技术所涵盖的 big picture?
  • 这个技术将何去何从?最新的方向是什么?
  • 针对具体的领域方法会有针对性的问题,事无巨细,秉承“以教促学”的思想,深入细节时从如何把我所学到的知识教给别人这个角度研究学习。(这样可以发现很多你以为你懂了其实你不懂的问题)

3. 模仿->拷贝->思考->内化

这个世界上产生的每一样新的知识和理论都有前人的影子,要想有所突破,仅仅在想突破的那个点发力是远远不够的,我们得先偷师前人,构建一棵完整的知识树。学习牛顿,站在巨人的肩膀上才能做出好的研究。我们要模仿别人,并且是刻意模仿,复现别人的方法,实现别人实现过的代码,关键在于在模仿的过程中要不断的问问题,比如这个实验为什么要这么设计?有没有其他更好的设计方法?这个方法的前世今生又是什么?作者是站在什么的基础上想到这种新的方法的呢?

我们真正要模仿的不是表面的问题,而是背后的思考过程,这就是内化。

我们需要不断的模仿->拷贝->思考->内化,以此来激发自己的idea。

人生如舞台,有时候你在前台,有时候在后台。做研究,大部分的时间都是吭哧吭哧慢火细熬的功夫,是后台,是里子,是鲲化成鹏之前的沉潜浮动。水击三千里,抟扶摇而上九万里固然轰轰烈烈,气吞山河,但在那之前,要耐得住寂寞,留得住青山。

 

前面的都是做研究的大方向,那么我们着眼于眼前的一些具体的事,我们做研究应该做些什么呢?

 

从阅读文献开始

通常应该先读综述性论文。各个领域都有最顶级的综合性学术技术刊物,从中可能找到最权威的综述论文

读什么文章很有讲究,现在是个知识爆炸的时代,各种论文满天飞,我们要把时间尽量放在读那些好的高质量论文上,我们可以从出版单位、影响因子、引用量来大致评估一篇文章是否值得一读。

读论文也分精读和泛读,起初要精读,等到你对这个领域的理解比较深刻了,之后的相关文章可以泛读,着重看那些创新点。

精读的方法:

先读提要、前言、图表、结论,不急于细读正文。读后好好思考一下,文章作者要处理的是什么问题;他为什么要研究这个问题;他得出了什么有意义的结果和结论。通过这些思考,经验丰富的研究者有可能设想出某些处理问题的理论方法,然后再阅读正文,可以比较与作者文中的理论方法有何异同。对大多数研究生,达到这个水准还需要时日,但不妨自我训练一下。这对于提高你发现问题和解决问题的能力大有好处。对于一些新颖、陌生的论题,任何人都可能出现阅读和理解上的困难。如果你认定必须读懂,只有一种办法可以帮你,就是坚持。这种论文可能要反复读多遍。如果你认真思考过,你会发现,几遍以后会豁然开朗。

读懂只是第一步,必须在阅读中不断提出问题,你必须逐步进步到第二层次:对文章进行审视。为了取得审视能力,你必须收集和细读同一个论题的几篇文章,特别是重要的源头文章。为此,你需要判定文章的重要性,只有重要的文章才值得你去花气力

 

你可以问导师的八件事,也是指导教师会帮你做的八件事情是:

第一件,你想出选题跟导师讨论,导师会给你建议是否有意义、是否可行、是否同意你做,也或许是让你再看更多的文献资料来论证这个选题是否有新意或是否有可行性,最终告诉你能不能做这个选题,除非是你导师课题要求做的选题可以直接确定要你做;

第二件,你设计出来的方案跟导师讨论,导师帮你修改方案,建议你如何去修改完善,最终敲定并告诉你可以实施;

第三件,方案实施过程中自己解决不了的困难,导师会帮你

第四件,对研究的数据结果可疑,自己查找并分析原因后,需要与导师讨论其原因并获得导师的意见,决定是否补充该部分试验;

第五件,自己写出该部分研究的论文,交给导师修改,导师会提出哪些地方需要如何完善和论证,哪些地方不够规范等,返回给自己修改;

第六件,自己查好各个相关期刊的特点、审稿时限长短和影响因子等,跟导师汇报后,导师帮你敲定投哪一个期刊。然后你按期刊格式非常详细的规范格式,连同参考文献格式、符号等都完全规范后,自己上网完成投稿;

第七件,有的期刊需要导师确定才能完成投稿,这时候需要提醒导师帮忙同意确定;

第八件,返修回答信写好后,跟导师讨论获准返回编辑部,反复直到稿件接收并给编辑部授权。我认为,这是一个非常好的导师能做到的了,导师不是帮你写论文,只是指导你前进。

自己要主动去做的事:

1)研一开学后,根据导师的研究课题,主动考虑那一块适合自己,自己对那一个方向的子课题有兴趣,初步查阅相关资料后,提出科学问题并找导师讨论选题,听导师的进一步安排。根据课题需要和科学问题来选题。

2)根据选题设计研究方案,详细到研究方法的每一个步骤拟如何实现,再找导师讨论

3)根据导师的建议完成整个方案的修改,解决好每一个存在的问题。

4)依照方案实施试验。准备好一切器材、人力安排,并带领相关人员完成试验内容。

5)数据处理及分析。完成试验后,得到的数据要进行处理分析,最常见的比如方差分析、相关性分析、趋势图、分布图等可以表征你研究结果的图或表。做成图或做成表需要根据自己要说明的问题目标来选择最适合的表达方式,同一组数据做成图就不能再用表重复表达,即同样的数据用图或表来表示时只能选择一种。

6)根据结果涉及到的内容再次针对性的查阅大量文献,找出自己的数据与别人的数据之间的差异,思考这样的结果是否回答了我开始设计的科学问题?以及思考自己的结果能说明什么新问题?就此写出一篇好论文;或者从文献中,确定自己的结果与别人的结果之间的gap,写完一篇小论文。正常情况下,试验完成后一个月内能写完论文。在其过程中可以问导师一些诸如“您看我这样的趋势和分布,能否得出......这样的结论?”。成稿后返回给导师修改,再根据导师的建议完善稿件。

7)查看相关期刊的影响因子、各期刊的特点和审稿周期等,找导师汇报,敲定目标期刊。

8)准备好给编辑的信或期刊要求的letter,导师认可后,自己上网完成投稿。

9)稿件返修过程中,自己再查阅文献并首先完成修改,需要与导师讨论的地方再找导师讨论。自己起草好回答信后与导师交流,获准后方能将修改稿返回编辑部。

 

在研究工作中,需要:

(1) 投入相当的时间和精力,从具体、从细节做起。

每天至少6-8小时 (5年便可达到一万小时)。必须通过长年累月的积累,才能形成对学科领域的深入了解、宏观把握和对所研究问题在整个学科中所处位置的正确认识。否则,再聪明也无济于事。

(2) 反复思考所研究的问题,找出自己的研究动机。

不断问自己,研究这个问题是为了什么?现在世界范围内对这个问题的研究进展如何?有哪些没有解决的问题?通过什么方法来解决它?

(3) 能放弃、会变通。

有两种情况,一是遇到无法克服的困难,二是有了新的更好的灵感。一旦遇到难以克服的困难,确认无法解决后,应考虑放弃。在由于困难而终止一个题目的时候,应当与导师等讨论,如果发现是死胡同,则应该选择放弃。

或者在研究过程中,突然发现了一条分岔路,可能比之前的方法更好,则千万不要放过新的方法或者灵感,科研工作的本质就是你无法提前知道它的终点在哪。

(4) 适可而止。

研究不能但可以无休止地进行。那么纵观已有的工作,何时才能构成一篇相对完整的论文?即什么阶段、什么状况下才能收手?多跟导师讨论,这是只有在有能力对问题和背景宏观把握后才能正确判断的。有人说:一点之见即成文,是有道理的。

(5) 先打外围、迂回前进

作为初学者,应考虑尽量避免直接研究那些竞争激烈、争议巨大的领域内核心问题,而多应采用迂回战术,先通过研究旁人涉足较少的外围问题进入领域。这样可避免在尚未掌握学科动态的情况下便卷入争议,或避免因了解问题不够全面而被他人忽视、批评或拒稿,有时甚至会受到不同派系的人的学术打压。经过几年积累后,或可尝试解决那些核心问题。

(6) 在工作中带着问题去学习、模仿是”学成”的捷径。

事实上,成功的科学工作者并不需要了解所研究课题的全部背景、进展的所有侧面和细节。人的精力非常有限,一般都不可能把课题领域甚至是密切关联的小方向上的所有进展了解清楚。这时,须有所侧重,分清什么内容是必须搞清楚的,什么内容只需宏观了解而不用关心细节。初学者,在经历一段时间(如两三个月)的文献阅读之后,就应该着手部署具体的研究工作,再在工作中根据出现的问题有针对性地阅读文献进行补习,在工作中带着问题去学习。等所有细节都清楚之后再开展工作,是不可行的。通常,为了避免由于了解问题不够全面而犯错,可以找出近期发表的、内容非常相近的论文,模仿和重现文中所有的图表和分析,熟悉作者的表述方式,再在此基础上研究和表述自己的问题。模仿、重现内容相近的已有工作是初学者学习的捷径。

(7) 将问题分解或逐层剥离,分解成若干简单的问题。

这也体现了一个人研究和解决问题的能力。一个复杂问题往往可以分解或逐层剥离,先从最简单的问题入手,逐个、一次瞄准一个地解决问题。例如阅读复杂的程序,最容易的办法就是划块处理,先明确各个功能块(有时是子程序)及之间的衔接,再拼在一起。有时问自己:要想解决我的问题,必须先解决另外什么问题?每解决一个具体问题后,都应该留下详细的记录和体会,供后面查询。

8) 明确论文(工作)的主要结论,找出论文的亮(卖)点。

论文的主要结论,例如新的发现,可以构成论文的亮点;亮点也可能是研究环节中采用的新技术手段,新想法或新数据等。自己应当清楚自己的工作到底亮在何处?为什么要做这个工作,新在何处,亮在何处?这是论文的主线,应当抓住。任何一篇论文,都可以用几句话将这些要害说清楚,应该不断尝试如此表述自己的工作。

(9) 理顺论文的逻辑框架。

论文的书写是一个梳理思路、反思、推敲整个研究过程的重要环节;通常成文过程中会发现已有工作中的不足和需要改进与补充之处;论文应以主线做指引,合理安排各部分内容(可采用较固定的格式,一般由:摘要、引言、模型或数据或实验的介绍、具体工作内容、主要结论与讨论组成)的先后顺序,形成一个有机整体。这里主要涉及的是整体上的逻辑顺序,还有一种逻辑问题是在具体行文过程中需要注意的,在下一段中涉及。每个人都对自己采用的素材非常熟悉,但如何安排他们则体现了一个人的逻辑思考与宏观把握能力。

论文书写对逻辑和上下文的连贯性要求很高,什么内容先出现,什么后出现,都应当符合逻辑上的习惯。前言和后语的配合也是非常重要的,必要时还可采用伏笔、倒叙等手法。可参考以下建议,提高自己的写作能力:(1) 从知名学者的论文中学习,阅读同时注意整理和理解作者的整体思路,换位思考,把自己想象成作者来把握文章的脉络,可总结出各段的段落大意、绘制出文章的逻辑框架图;(2) 经常,在段落的第一句,可以点明该段的主要意思,然后展开叙述。在总结现象主要特征、主要原因和规律时,可考虑采用按条归纳的方式,将内容分解归为若干条款,有利于提高可读性和条理性。

(10) 摘要与结论、引言与讨论

大部分人读你的文章可能只看摘要或结论,再者看引言和讨论,很感兴趣的才会阅读正文。摘要是研究工作的高度浓缩,是读者快速了解论文内容的窗口。摘要最后一句通常是点出或提升整个文章在学科发展中科学意义的一句话,属于画龙点睛笔。摘要有时容易与结论部分混淆。摘要一般应当更加通俗和概括一些,而结论是在经过长篇论证之后给出的,可更专业和具体。

引言需陈述相关背景、并通过这些陈述逐步引出本文的研究动机、目的、主要思路等。讨论部分也是非常重要的,作者应对自己的研究工作作出恰当评判、介绍其在推动学科发展方面的作用、与密切相关的其它工作的区别和改进、以及在广度和深度上对自己研究工作的内涵进行拓展、还有将来的研究意图等。如果讨论部分比较匮乏,会被认为作者的知识面较窄、对相关研究工作的认识深度不够。

(11) 读书破万卷、下笔如有神

在写作第一篇科研论文时,经常会有同学感到语言匮乏,不知道如何描述辛辛苦苦准备出来的图表和数据分析结果。而查阅文献,则能感受到其他作者们的洋洋洒洒千言万语,似乎很平淡的事情也能说得头头是道。其实,通常一篇论文,在引言和实验理论与分析方法等基本介绍之后,就该到“看图说话”部分了。这部分是一篇文章的“血肉”,构成文章的正文。如果看着图,却感觉无话可说,只能说明作者知识的贫瘠,对有关问题的了解也不够深入。这时,最好是作者能找到若干密切相关的文献,充分阅读。从反复阅读中学习和把握其他作者是如何描述有关物理过程的,对于类似的过程需要从哪几个侧面展开叙述,存在哪些感兴趣的、值得描述的兴奋点等。对着一幅图,要能说出为什么要制作该图、该图是如何制作的、图上有哪些曲线有何变化趋势等;要能指出图中最重要的特征是什么、有哪几个其他的特征,这些特征说明了什么问题、对本文核心观点起到什么支撑作用等。每一幅图表都会包含一条或几条关键的线索,每条线索都是支撑核心观点的一个论据。将这些线索逐个阐述,在最后总结所有线索的时刻就可以作为抛出核心观点的时刻。所以,写文章前不但要做到"读书破万卷",有的文献还要熟读多遍,充分理解相关工作后下笔方能有如神助。

(12) 中英文书写

通常认为,英文写不好,难道中文还写不好吗?其实,对很多研究生而言,并非一开始就能写好中文的。这是因为论文写作自然不仅仅是书写汉字,更重要的是要体现科学层面的要求,论文框架安排需要符合整体的逻辑思路,内容还要简略得当,叙述严谨等;论文书写质量与个人的宏观把握、逻辑思维、材料组织与文字驾驭能力密切相关。写过几篇科研论文的人,干文秘、办公室等文字型工作都是绰绰有余的。

有一个常见问题,对于英文论文,应该先中后英,还是直接用英文书写?不同人会有不同的看法。从个人经验出发,我觉得先中后英更好一些。虽然,我们目前较少发表中文文章,但是我们的各类项目经费申请,各种国内需要递交的材料大都是用中文写就。所以,对一个在国内工作的人而言,中英文的书写能力是同等重要的。另外,对于刚涉入研究领域的研究生而言,未必能用英文自由地表达自己的思想,这时,应当首先通过中文的书写过程彻底清理自己的思路,将文章中要表述什么、如何去表述完全理顺。即首先用中文处理好科学与逻辑层面的问题,剩下的就基本只是语言层面的问题了。这种处理方式实际上就是遵循将复杂问题分解的思路,即将科学问题与外语问题剥离并分别处理。

如果将科学、逻辑、语言的问题混杂,则可能无法表述清楚文章最为根本的科学内容和思想,容易使他人难以理解作者的科学思想。写英文稿时,请勿直译,而应将英文写作视为“二次创作”过程,即首先抓住要表达的意思,再用英文思维方式阐述出来。(若导师要求直接用英文书写,或个人英文表达能力很强可另论)。

在如何提高英文写作水平方面,有以下建议,(1)从英语为母语的同行论文中学习英文写作,通过阅读出声的方式增强自己的语感;在读书过程中收集“好词好句”也是经常被推荐的一种提高英文写作能力的方法,(2)参详导师或水平更好的人对自己论文的修改也是提高写作水平的一个途径,(3)已去世的江涛博士曾为中国天文工作者写过英文语法方面的专门讲义,可参考。

 

(13) 投稿与审稿回复。

投稿的具体刊物可根据论文的内容、导师的意见择定。

对于审稿人的意见,则需要慎重、认真地对待。审稿意见是同行专家从完全不同的角度去理解你的问题,因此,不管是什么样的意见,都能使你了解到同行的看法,对其认真处理,一般都会有利于将文章内容阐述得更加清楚,使科学内容的表述更加全面、更加容易让人接受。以下几点意见供参考。

(1) 写回复意见时,对审稿人应表示感谢,要表现出对审稿劳动的尊重和自己认真修改的诚意来;

(2) 应仔细体会评审人的意见,特别是英文意见,能将其要点全部标出、仔细地揣摩审稿人的出发点和意图,对审稿人暗含的意思(如果有的话)和要点进行总结,避免做出“答非所问”式的回答;对所有的要点都要逐一答复,并在回复中注明文中修改之处,这一般在编辑的要求中也会说明

(3) 对于自己需要坚持的内容、或者有较大不同意见时,应注意尽量周全地阐述自己的理由;用具体的理由、而不是情绪去答复审稿人的意见;对于审稿人曲解之处,则应当首先从自己文字中寻找原因:如果小同行的专家会曲解你的文字,则说明其他大部分人也可能会如此,所以应尽量修改自己的文字使词能达意并方便他人理解。

本文参考文章:

1、https://zhuanlan.zhihu.com/p/31975770

2、https://zhuanlan.zhihu.com/p/34326465

;