目录
大学生恋爱数据分析报告
内容提要:本文依据“大学生恋爱数据”,对大学生恋爱状况和恋爱影响因素进行分析。被调查的学生中,大四学生最多,男女比例基本一致,大部分学生来自于二三线城市,身高介于155-185cm之间,体重介于40-70kg之间。被调查学生中,72%的人恋爱,大部分人被别人追求过且为党员,且会跑步、打羽毛球、吹乐器和唱歌。用全模型对第一个受访者的恋爱状况进行预测时,分界点α=0.5 时判断正确,α=0.3 时判断错误。是否追求过别人、是否被别人追求过、寝室同学是否谈过恋爱和每月话费对是否恋爱由显著影响。结合ROC曲线和AUC值可以得出,三个模型中AIC模型分类效果最好。
一、研究目的
近年来,老龄化愈发严重,新生儿出生率显著降低。婚姻是生育的前提,探究现代人的婚恋观具有重要意义。00后婚恋观与以往发生了较大变化,计划终生不婚在00后中较为常见,调研青年人婚恋观的影响因素,对于提升生育率有重要意义。本文旨在依据“大学生恋爱数据”,分析大学生恋爱现状,进而得出大学生恋爱的影响因素。
二、数据来源和相关说明
数据来源于“大学生恋爱数据”文件,据此分析大学生恋爱现状与影响因素。数据共包含32个变量,包括一个因变量和31个自变量。根据变量的含义,将31个变量分为了七类——基本信息、恋爱情况、职务情况、运动情况、才艺情况、颜值情况和生活规划情况。由于变量较多,本文用给定的符号代表这些变量,具体符号与变量解释如表2-1所示。
表2-1 变量解释与符号
变量 |
解释 |
符号 |
变量 |
解释 |
符号 |
是否恋爱 |
0-否;1-是 |
Y |
唱歌 |
0-否;1-是 |
CY1 |
年级 |
1-大一;2-大二; 3-大三;4-大四 |
JB1 |
主持 |
0-否;1-是 |
CY2 |
性别 |
0-男;1-女 |
JB2 |
舞蹈 |
0-否;1-是 |
CY3 |
家乡 |
1-一线城市;2-二线城市; 3-三线城市;4-县级市; 5-农村 |
JB3 |
乐器 |
0-否;1-是 |
CY4 |
身高 |
连续变量 |
JB4 |
其他才艺 |
0-否;1-是 |
CY5 |
体重 |
连续变量 |
JB5 |
是否戴眼镜 |
0-否;1-是 |
YZ1 |
是否追求过别人 |
0-否;1-是 |
LA1 |
颜值 |
连续变量 |
YZ2 |
是否被别人追求过 |
0-否;1-是 |
LA2 |
每周自习时间 |
连续变量 |
GH1 |
寝室同学是否谈过恋爱 |
0-否;1-是 |
LA3 |
每周娱乐时间 |
连续变量 |
GH2 |
班干部 |
0-否;1-是 |
ZW1 |
每周睡觉时间 |
连续变量 |
GH3 |
党员 |
0-否;1-是 |
ZW2 |
每周运动时间 |
连续变量 |
GH4 |
足球 |
0-否;1-是 |
YD1 |
每月话费 |
连续变量 |
GH5 |
篮球 |
0-否;1-是 |
YD2 |
学生组织个数 |
连续变量 |
GH6 |
乒乓球 |
0-否;1-是 |
YD3 |
成绩水平 |
连续变量 |
GH7 |
羽毛球 |
0-否;1-是 |
YD4 |