Bootstrap

【统计模型】大学生恋爱数据分析报告

目录

大学生恋爱数据分析报告

一、研究目的

二、数据来源和相关说明

三、描述性统计分析

3.1 基本情况

(1)年级、性别、家乡情况

(2)身高、体重情况

3.2 恋爱情况

(1)恋爱比例

(2)恋爱史

3.3 职务担任情况

3.4 运动情况

3.5 才艺情况

3.6 颜值情况

3.7 生活规划情况

3.8 变量间的相关性

(1)连续型变量热力图

(2)连续变量与是否恋爱的关系

四、数据建模

4.1 全模型

(1)模型建立

(2)结果预测

4.2 基于AIC准则下的选模型A

4.3 基于BIC准则下的选模型B

4.4 模型评估

五、结论及建议

5.1 结论

5.2 建议

六、代码


大学生恋爱数据分析报告

        内容提要:本文依据“大学生恋爱数据”,对大学生恋爱状况和恋爱影响因素进行分析。被调查的学生中,大四学生最多,男女比例基本一致,大部分学生来自于二三线城市,身高介于155-185cm之间,体重介于40-70kg之间。被调查学生中,72%的人恋爱,大部分人被别人追求过且为党员,且会跑步、打羽毛球、吹乐器和唱歌。用全模型对第一个受访者的恋爱状况进行预测时,分界点α=0.5 时判断正确,α=0.3 时判断错误。是否追求过别人、是否被别人追求过、寝室同学是否谈过恋爱和每月话费对是否恋爱由显著影响。结合ROC曲线和AUC值可以得出,三个模型中AIC模型分类效果最好。

一、研究目的

      近年来,老龄化愈发严重,新生儿出生率显著降低。婚姻是生育的前提,探究现代人的婚恋观具有重要意义。00后婚恋观与以往发生了较大变化,计划终生不婚在00后中较为常见,调研青年人婚恋观的影响因素,对于提升生育率有重要意义。本文旨在依据“大学生恋爱数据”,分析大学生恋爱现状,进而得出大学生恋爱的影响因素。

二、数据来源和相关说明

      数据来源于“大学生恋爱数据”文件,据此分析大学生恋爱现状与影响因素。数据共包含32个变量,包括一个因变量和31个自变量。根据变量的含义,将31个变量分为了七类——基本信息、恋爱情况、职务情况、运动情况、才艺情况、颜值情况和生活规划情况。由于变量较多,本文用给定的符号代表这些变量,具体符号与变量解释如表2-1所示。

表2-1 变量解释与符号

变量

解释

符号

变量

解释

符号

是否恋爱

0-否;1-是

Y

唱歌

0-否;1-是

CY1

年级

1-大一;2-大二;

3-大三;4-大四

JB1

主持

0-否;1-是

CY2

性别

0-男;1-女

JB2

舞蹈

0-否;1-是

CY3

家乡

1-一线城市;2-二线城市;

3-三线城市;4-县级市;

5-农村

JB3

乐器

0-否;1-是

CY4

身高

连续变量

JB4

其他才艺

0-否;1-是

CY5

体重

连续变量

JB5

是否戴眼镜

0-否;1-是

YZ1

是否追求过别人

0-否;1-是

LA1

颜值

连续变量

YZ2

是否被别人追求过

0-否;1-是

LA2

每周自习时间

连续变量

GH1

寝室同学是否谈过恋爱

0-否;1-是

LA3

每周娱乐时间

连续变量

GH2

班干部

0-否;1-是

ZW1

每周睡觉时间

连续变量

GH3

党员

0-否;1-是

ZW2

每周运动时间

连续变量

GH4

足球

0-否;1-是

YD1

每月话费

连续变量

GH5

篮球

0-否;1-是

YD2

学生组织个数

连续变量

GH6

乒乓球

0-否;1-是

YD3

成绩水平

连续变量

GH7

羽毛球

0-否;1-是

YD4

;