本节书摘来自华章出版社《Stata统计分析与应用(第2版)》一书中的第3章,第3.2节,作者 周广肃,更多章节内容可以访问云栖社区“华章计算机”公众号查看
3.2 直方图、散点图和曲线标绘图的绘制
直方图、散点图与曲线标绘图是较为常用的三种统计图形,常用来表示数据的分布和变化趋势,本节将会通过例子介绍三种图形的基本绘制方法。
3.2.1 直方图的绘制
直方图是用矩形的面积(即长度和宽度)来表示频数分布的图形,在平面直角坐标系中,一般用纵轴表示频数或频率,用横轴表示数据的分组。通过该种图形,用户可以较为直观地了解数据的整体情况,如分布类型、中心位置、分散程度等。
在Stata中绘制直方图的最基本命令语句为:
histogram varname [if] [in] [weight] [, [continuous_opts | discrete_opts]
options]
varname是将要绘制图形的变量,if是条件语句,in是范围语句,weight是权重语句。下面将要着重介绍的是 histogram的选项,如表3.2所示。
例如,利用usaauto文件,绘制一个关于mpg变量的最为基本的直方图。此数据是根据统计资料得到的美国汽车产业的横截面数据(1978年),完整的数据位于本书附带光盘data第3章usaauto.dta工作文件中。
输入命令:
histogram mpg
这个命令语句只告诉Stata为变量mpg绘制直方图的基本命令,而不进行任何设定,这时Stata将绘制出如图3.4所示的直方图。
但是这个图形过于简单和粗糙,我们可以对图形进行以下优化设置:
为图形添加标题“mpg直方图”。
把直方条的数目由现在的8个增加到10个。
增加脚注“数据来源于美国汽车协会”。
横轴刻度范围为从10~45,刻度单位为5,名称为“每加仑油行使英里数/单位:英里”。
为图形添加一条正态曲线。
标注直方条的高度。
完成以上设置,可重新输入绘制图形的如下命令:
histogram mpg, title(mpg直方图) bin(10) note(数据来源于美国汽车协会)
xtick(10(5)45) xtitle(每加仑油行使英里数/单位:英里) norm addlabels
在上述命令语句中,“title(mpg直方图)”的作用是对图形添加标题;“bin(10)”的作用是设置直方条数目为10;“note(数据来源于美国汽车协会)”用于设定脚注的内容;