Bootstrap

论文写作心得


本文章是结合闵老师上课以及看老师博客内容后自己的一些心得体会。文章链接: 《论文写作》

论文写作心得

1. 前言

这学期学了闵老师的论文写作课程,首先了解到论文结构的重要性。老师讲了论文中每一个部分应该怎么去写,需要去避开哪些坑,这可以为我们后续写论文做一个很好的参考; 其次是我们在写论文中要符合相应的规范,不要有语法和拼写错误等,在写论文中最好借助辅助工具如Latex,去帮助我们为论文排版;最后,课程为我们提供了一些闭坑点,尽量让我们在写论文的过程中不要犯低级错误。接下来我会结合老师讲的内容去梳理学习一些知识点来加深自己的理解。

2. 论文写作工具-Latex

Latex安装教程参考:文章链接
Latex一个学习中心:文章链接
在写论文时,最好不要用word去写论文,这即显得不专业同时后面调整格式应该会抓狂,所以前期就要选好写论文的工具,并且格式确定以后还方便以后复用,可谓事半功倍。如下是Latex文件老师给出的一些建议: 我们在写论文(尤其对小白而言)最好不要重头写,这样不仅耗时而且完全没必要,我们可以站在巨人的肩膀上,去找已录用论文的源文件或者找期刊提供的模版文件。

2.1 latex常用的文件

  • .cls文件
    是一个用于定义文档类(document class)的文件,用于指定文档格式和排版规则的模板,通常用于撰写不同类型的文档,如论文、报告。一般使用\documentclass{}导入。
    如下是一些举例:
    • IEEEtran.cls文件
      如下代码包括了文档的标题、作者信息、摘要和关键词。
\documentclass[journal]{IEEEtran}

\usepackage{algorithm}
\usepackage{algorithmic}
\usepackage{arydshln}
\usepackage{amsmath}
\usepackage{amssymb}
\usepackage{booktabs}
\usepackage{bm}
\usepackage{hyperref}
\usepackage{multirow}
\usepackage[misc]{ifsym}
\usepackage{pdfpages}
\usepackage{subfigure}
\usepackage{url}

\renewcommand{\algorithmicrequire}{\textbf{Input:}}
\renewcommand{\algorithmicensure}{\textbf{Output:}}
\newtheorem{definition}{Definition}

\hyphenation{algorithm}
\hyphenation{classifi-cation cha-llenge costs}
\hyphenation{values}

\begin{document}

\title{This is the title}

\author{Mei~Yang,
        Yu-Xuan~Zhang,
        Xizhao~Wang,~\IEEEmembership{Fellow,~IEEE},
        and~Fan~Min,~\IEEEmembership{Member,~IEEE}
\thanks{This work was supported by xxx.).
(\emph{Corresponding author: Fan Min}.)}
\thanks{Mei Yang is with the School of Computer Science, Southwest Petroleum University, Chengdu 610500, China
(e-mail: [email protected]).}
\thanks{Yu-Xuan Zhang is with the School of Computer Science, Southwest Petroleum University, Chengdu 610500, China
(e-mail: [email protected]).}
\thanks{Xizhao Wang is with Institute of Big Data, Shenzhen University, Shenzhen 518060, China
(e-mail:  [email protected]).}
\thanks{Fan Min is with the School of Computer Science; Institute for Artificial Intelligence, Southwest Petroleum University, Chengdu 610500, China
(e-mail: [email protected]).}
}

\maketitle

\begin{abstract}
This paper xxx.
\end{abstract}

\begin{IEEEkeywords}
Distinguishability, ensemble learning, mapping, multi-instance learning and self-reinforcement.
\end{IEEEkeywords}

\IEEEpeerreviewmaketitle

其中:

  1. \documentclass[journal]{IEEEtran}:指定了文档的文档类为IEEEtran,并选择了"journal"模式,这通常用于排版期刊论文。
  2. \usepackage命令: 导入了一些常见的宏包.如amsmath和amssymb(用于数学公式)
  3. \renewcommand: 重新定义了algorithmic包中的算法关键词,如"Input"和"Output",以进行本地化定制
  4. \newtheorem: 创建了一个新的定理环境,名为definition,它会自动进行编号
  5. \hyphenation: 定义了一些需要手动断词的单词,以控制文本排版中的断词。
  6. \begin和\end之间是文档的正文部分,包括标题、作者信息、摘要、关键词等。
  7. \maketitle:用于生成标题页,显示了标题和作者信息
  8. \IEEEpeerreviewmaketitle: 用于生成IEEE期刊的标题和作者信息。
  • bst文件
    用于控制参考文献格式的重要组成部分。其定义了引用和参考文献的外观和格式,包括文献引用的排序方式、作者名字的格式、文献标题的格式、引用样式等;一般使用\bibliographystyle{}导入
  • bib 文件
    进行参考文献的管理,用于描述和处理引用列表。是参考文献的库,一般使用\bibliography{}导入.其中注意事项参考原文:文章链接

2.2 表格控制

Latex表格控制,在论文中,表格控制主要是格式要对齐。 其中表格一般要与文字边距相同,数据对齐格式要根据所发期刊的风格来灵活挑战。具体的格式参考文章

2.3 小技巧

文章链接

3. 论文各个部分

我将结合我最近看的一篇论文去理解这部分内容。题目为:《Deep-learning inversion: a next generation seismic velocity-model building method》 论文链接

3.1 论文题目

文章链接
标题是吸引读者注意力的第一印象。一个好的标题应该简明扼要、具有吸引力、准确传达论文的主题和内容。在老师提出的建议中提出的最好不要使用based on,首先是因为他使用的太多了,其次我认为在论文标题中过多使用"基于"会给读者一种该论文只是对已有方法进行简单扩展或应用的印象。
eg:
题目:《Deep-learning inversion: a next generation seismic velocity-model building method》
题目直接传达了论文主题:即构建速度模型,且是基于深度学习反演的速度模型构建。

3.2 论文摘要

文章链接
摘要是论文中的一个非常重要的部分,它在简短的文字中提供了读者关于论文内容的概要。他通常包含已有工作的的简要评述,以帮助读者了解当前研究领域的背景和相关研究的重要性,其次就是要对本文研究的描述即本文的主要贡献或创新,最后应该包含分对实验结果的简要总结。摘要很重要,读者读了之后可以决定是否继续深入读这篇论文,所以他应该简单明了且直击要点。

  • 问题及其重要性(可以说明问题所属的领域, 解释最重要的概念, 或者强调问题的重要性.)
  • 已有工作(述该问题的流行解决方案)
  • 已有工作的局限(以 However 开头, 需要注意指责要委婉,其实也可不写)
  • 本文工作(以 In this paper 开始)
  • 本文多个技术/步骤/方面/优势/贡献
  • 实验设置(给出数据的领域、来源、数量.)
  • 实验结果(提高了准确性、效率等等.)
  • 提升(可以说下论文的意义)

我结合我最近看的一篇论文去理解如何写摘要(老师给出的规范10句,但这篇虽然不是10句,但老师给的建议依然是很有用的,因为摘要表达的内容核心是一样的)

    1. 问题及其重要性:

Seismic velocity is one of the most important parameters used in seismic exploration. Accurate velocity models are key prerequisites for reverse-time migration and other high-resolution seismic imaging techniques.

这段话说明了速度模型在地震勘探中很重要,突出问题的重要性。(而本文主要讲的就是速度模型的构建)

    1. 已有工作的局限

Such velocity information has traditionally been derived by tomography or full-waveform inversion (FWI), which are time consuming and computationally expensive, and they rely heavily on human interaction and quality control

说明传统工作的不足,耗时高,成本也高

    1. 本文工作

We investigate a novel method based on the supervised deep fully convolutional neural network (FCN) for velocity-model building (VMB) directly from raw seismograms.
Unlike the conventional inversion method based on physical models, the supervised deep-learning methods are based on big-data training rather than prior-knowledge assumptions.

在本文中作者提出了他们自己的研究工作,研究了一种基于监督深度全卷积神经网络的新方法。

    1. 多个技术/步骤/方面/优势/贡献

During the training stage, the network establishes a non-linear projection from the multi-shot seismic data to the corresponding velocity models.
During the prediction stage, the trained network can be used to estimate the velocity models from the new input seismic data.
One key characteristic of the deep-learning method is that it can automatically extract multi-layer useful features without the need for human-curated activities and initial velocity setup.
The data-driven method usually requires more time during the training stage, and actual predictions take less time, with only seconds needed.
Therefore, the computational time of geophysical inversions, including real-time inversions, can be dramatically reduced once a good generalized network is built.

这段话描述了构建速度模型过程的步骤以及相关的技术。速度模型构建包括训练阶段恶预测阶段,在训练阶段需要自动提取特征学习,预测阶段判断训练模型是否训练好了

    1. 实验设置/实验结果

By using numerical experiments on synthetic models, the promising performances of our proposed method are shown in comparison with conventional FWI even when the input data are in more realistic scenarios。
Discussions on the deep-learning methods, training dataset, lack of low frequencies, and advantages and disadvantages of the new method are also provided.

这段话说明我们对模型进行数值实验比比较他们训练的结果。也表明该模型在未来有很好的前景。并讨论了相关的优缺点。

3.3 关键词

文章链接
关键词可以帮助读者和搜索引擎定位和检索相关论文,他可以看作是摘要的补充,且一般是3-5个关键词,每一个关键词由1-3个单词组成并将关键词按字母排序。(有些期刊支持两类关键词,一类由期刊提供 一类是作者自己写)

3.4 引言

文章链接
引言现在在很大程度上不再仅仅是一个铺垫,而更像是讲述一个完整的故事,以引导读者进入论文的主题和背景。在写论文引言的时候应该对整个故事进行详细的描述,要引起读者的兴趣,明确定义研究中要解决的问题或研究领域中的挑战,在引言中应明确说明研究的目标和研究问题的重要性,要强调研究的主要贡献或创新。可以采用最八股文的方式写引言,采用与摘要相同的节奏. 摘要的每一句, 都扩展成引言中的一段,每一段有5-10句。在计算机领域放 “开局一张图”,该图可以帮助读者花最少的时间理解论文的主要内容,通过这张图进行解释(如果没有好的图就别放了,放了可能反而会成减分项)

3.5 文献综述

文章链接
绝大多数的参考文献应在文献综述中引用.在每篇论文中都应有的文献综述,在写文献时,要保证文献的引入是有明确目的的,是为研究提供支持、背景和上下文,建立学术基础,而不应该为了引文献而引文献。相关引文献注意点,老师也在文章中说明。

  • 在论文中都应该有文献综述
  • 可以在不同地方描述
  • 文献需要进行分门别类的介绍(自顶向下 逐步求精)
  • 参考文献的引用一般仅仅是一种附属品。(先写一个完整的句子, 再把参考文献的引用加上去)
  • 不应将参考文献的引用作为句子的主语、宾语等(如:Min et. al [6] propose … 这样是要不得的)
  • 不要一次性引用太多文献,最好不要以年份为主线的综述,不要全局引用。
  • 评述相关工作的优缺点:评论优点要走心,评论缺点要委婉。

举例:如下这篇论文的引言(我结合4.4和4.5来看):
论文链接

  1. 第一段话讲述了构建速度模型很重要,以及引用了文献中提出为了构建好的速度模型采用的技术。
  2. 第二段话讲述了讲述构建速度模型的两种传统方法:层析成像方法和FWI,在描述过程中讲述了他们的优点,同时也委婉指出他们的不足,这也正是本文作者研究的问题。
  3. 第三段话讲述了:作者引入“机器学习”,并引用相关文献展示机器学习的优点,在此基础上作者也说出了自己的研究工作是结合机器学习算法来进行工作,表明自己的研究工作是很有前景的。
  4. 第四段话进一步讲述了机器学习中的一个分支深度学习,并引入有关深度学习研究相关的文献以及对自己研究工作的启发,并在他们的研究中提出自己想法。(这也是本文作者要深入探讨的问题)
  5. 第五六段讲述了本文作者研究的工作重点及优点

这篇论文的引言条理清楚,节奏一步步推进,内容逐步深化。文献的引用合理,对文献的评论都是中肯的。

3.6 论文理论部分

文章链接
对我们计算机专业而言,对数学语言的应用一定困难,但数学在我们机器学习又是很重要的,因此理解数学的内在涵义对我们很重要。我们可以结合老师在文章中提出的建议学习一些常用的数学描述。但是总的准则我们应该知道:理论应该完备;符号要保持同一风格;重要结论称为定理 theorem, 定理前面打辅助的叫作引理 lemma, 定理后面的尾巴叫推论 corollary, 附属于算法的叫 property.

在这篇论文《Deep-learning inversion: a next generation seismic velocity-model building method》中,涉及到的理论部分在Basic inversion problem; A review of the FCN; Mathematical framework中

3.7 算法伪代码

文章链接
算法伪代码是论文的核心之一,他描述了我们实验或研究的主要核心思想,在写算法伪代码过程中我们要注意的点:
1.要清晰的指出输入输出
2.要有主要的步骤同时最好写上注释,方便自己也方便别人
3.长度不要太长,最好控制在15-30行

如下是我最近看的一篇论文的伪代码过程:
在这里插入图片描述

3.8 实验部分

文章链接

  • 对于计算机方面,尤其是机器学习的论文,实验部分很重要也占据了论文一半的篇幅。机器学习需要依靠大量的数据集训练网络模型,所以数据集的选择以及收集尤为重要,它不仅提供了对研究方法有效性的客观验证,对可以为其他的研究者了解如何应用和扩展。
  • 实验的主要目的是回答一些作者和读者关心的问题.
  • 内部比较:参数变化所导致的性能变化;主要方案与其变种相比的优势.(如果有许多,只需要挑最重要的,太多反而不好)
  • 外部比较:与已有算法进行对比。相关的一些注意点参考原文。
    如在这篇论文《Deep-learning inversion: a next generation seismic velocity-model building method》中需要依赖大规模的数据集,其数据集的来源是两类数据集,一类是通过正演方程获得模拟数据集,一类是Seg盐模拟数据集(公开数据集)。对两类数据集进行了两种实验,在每种实验中都进行内部比较和外部比较。

3.9 结论

文章链接
论文中的结尾不宜太长,要避免与摘要重复,而是要突出观察和结论的具体性。此外提出未来工作建议可帮助其他研究者继续研究(可不计入结论中),这部分通常备受关注,因此写得出色有助于获得更多引用,引用数量比发表数量更重要。
如下最近论文中的结论:第一段话中就突出观察和结论的具体性,在第二段话中提出了作者未来的工作建议

In this study, we proposed a supervised end-to-end DL method in a new fashion for velocity inversion that presents an alternative to “conventional” FWI formulation. In the proposed formulation, rather than performing local-based inversion with respect to subsurface parameters, we used a FCN to reconstruct these parameters. After a training process, the network is able to propose a subsurface model from only seismic data. The numerical experiments showed impressive results in the potential of the DL in seismic model building and clearly demonstrated that a neural network can effectively approximate the inverse of a non-linear operator that is very difficult to resolve. The learned network still computes satisfactory velocity profiles when the seismic data are under more realistic conditions.
Compared with FWI, once the network training is completed, the reconstruction costs are negligible. Moreover, little human intervention is needed, and no initial velocity setup is involved. The loss function is measured in the model domain, and no seismograms are generated when using the network for prediction. In addition, no cycle-skipping problem exists.

The large-scale diverse training set plays an important role in the supervised learning method. Inspired by the success of transfer learning and generative adversarial learning in computer vision, and the combination of traditional methods and neural networks. We propose two possible directions for future work. The first is to generate more complex and realistic velocity models using a generative adversarial network, which is a type of semi-supervised learning network, based on the limited open dataset. Then, we can train the network with these complex datasets and apply the trained network to field data by transfer learning. The second is to uncover the potential relationship between conventional approaches for inversion and specific networks.
This approach enables to develop novel network designs that can reveal the hidden wave-equation model and invert more complex geological structures based on the physical systems. Further studies are required to adopt these methods to large problems, field data, and other applications.

总结:看完最大感受是:写篇好的论文不容易啊。 将整个论文都分支去了解了各个部分应该怎么写,要重点描述什么后,再去看老师这篇文章:第一篇论文写作流程,就有点自底向上的感觉了。在写论文时,我们首先要将我们的重点放在我们的实验上,代码能通,结果能呈现.(如果代码都跑不通那也不知道怎么写)其次再是算法描述,摘要,引言的描述。后续再不断地修改打磨。

4. 论文过程中应该注意的

如下是论文过程中需要避坑的,我汇总在这里,方便以后查阅。当然我希望以后我尽量不要遇到~

;