Bootstrap

“华数杯”全国大学生数学建模竞赛 C题优秀论文

没有更新完之前,专栏价格为59,更新完毕之后恢复到99. 专栏内包含2024年所有数学建模比赛思路和代码,有些重要比赛着重更新(华数杯、国赛、美赛),小比赛可能会有chatgpt4更新,只需订阅一次。有些文章没有完整代码,请到专栏内查找最新代码和思路。如果比赛结束后没有更新代码(可能会有事情来不及更新)赛后我会统一退款。

2024年第五届“华数杯”专栏地址:2024 年华数杯全国大学生数学建模竞赛 C 题 老外游中国 第一问详细代码。-CSDN博客https://blog.csdn.net/m0_52343631/category_12482955.html?spm=1001.2014.3001.5482

目录

2024年第五届“华数杯”专栏地址:https://blog.csdn.net/m0_52343631/category_12482955.html?spm=1001.2014.3001.5482

摘要

一、问题重述

二、问题分析

三、模型的假设

四、符号说明

五、模型的建立与求解

六、模型的评价与推广

七、参考文献

八、附录


2023年优秀论文

摘要

维护婴儿成长是社会发展的重要任务之一。本文针对婴儿成长问题,建立分类模型
及优化模型,对母亲的身心健康与婴儿成长进行分析,通过 MATLAB 软件求解,预测
最后 20 组婴儿的行为特征及睡眠质量,制定出合理有效的治疗方案使得编号 138 位婴
儿的行为特征从中等型转变为安静型,并在此基础上调整策略使该婴儿睡眠质量变为优。
首先对数据进行预处理。首先对问卷进行异常值处理,剔除婚姻状况为 3 6 的数
据。又编号 180 位受访者的为 99:99 ,故也删去。因此总共剔除数据 10 个。接着,对婴
儿行为特征、整晚睡眠时间进行量化处理。
针对问题一,根据题目要选取母亲的身体指标、心理指标、婴儿的行为特征和睡眠质
量作为指标。考虑到母亲的身体指标有 4 个变量,心理指标有 3 个变量,且变量之间具有
相关性,则先利用主成分分析法进行降维,再分析变量间是否存在相互关系,从而达到简化
题目的效果。接着 使用 Spearman 相关系数分析,得到: 母亲的身体指标与婴儿行为特征、
睡眠质量之间不存在显著影响,无线性相关性;母亲的心理指标与婴儿行为特征、整完
睡眠时间、睡醒次数之间存在显著影响,存在线性关系。
针对问题二,首先针对婴儿行为特征的分布状况以进行描述,结果表明不需对样本
进行采样。接着对模型进行似然检比卡方检验, P 值小于 0.05 ,可使用有序逻辑回归模
型。然后计算回归系数,再根据因变量阈值表,得到最终的有序逻辑回归模型。结合混
淆矩阵与准确率,对模型进行评估,结果表明模型质量较好。并通过建立的有序逻辑回
归模型得到最后 20 组的分类结果。
针对问题三 , 首先根据给出的患病得分与治疗费用之间的关系,确定总治疗费用心理
指标的关系,并引入上四分位数与下四分位数作为每种婴儿行为特征的边界范围,建立
婴儿行为特征约束的单目标最值优化模型,最后通过智能算法计算出婴儿行为特征从矛
盾型变为中等型所耗费的治疗费用最少为 28159 元,从矛盾型变为安静型所耗费的治疗
费用最少为 33564.67 元。
针对问题四,首先查找参考文献,确定婴儿睡眠质量优良中差比例分别为 16.74%
16.74% 16.74 49.77% 。采用灰色关联度模型对 380 个观测值综合排序。按照确定的比
例划分即可得到婴儿睡眠质量的综合评判结果。再对睡眠质量的评判结果量化,将优、良、
中、差分别量化为 3 2 1 0 。接着建立随机森立分类模型,预测最后 20 组婴儿的综合睡
眠质量的类别,并对随机森林分类模型进行评估。
针对问题五,首先确定婴儿优质睡眠质量边界条件,然后在问题三模型的基础上,
将确定婴儿优质睡眠质量中 3 种心理指标的范围作为约束条件添加入模型中,建立最少
治疗费用的单目标多约束优化模型,最后采用智能算法求解出问题三基础下婴儿优质睡
眠质量时最少的治疗费用为 35134 元,而变为安静型是最少的治疗费用为 36004.67 元。
本文所采用的模型可以很好地根据实际情况解决分类问题和优化问题,具有较好地
适用性和准确性。并且,本文对模型结果进行分析,对模型性能进行评估,同时提出了
改进方向,完善模型,以扩大使用范围。
关键词:婴儿成长 有序逻辑回归分类模型 规划模型 随机森林分类模型 身心指标

一、问题重述

1.1 问题背景
婴儿是国家人口增长的重要组成部分,维护婴儿成长是中国社会发展的重要任务之
一。而婴儿人生中最重要的人之一便是母亲,母亲既作为营养提供者和身体保护者,又
作为情感支持者和安全提供者。故婴儿的生理和心理健康可能受到母亲身心健康状态的
影响,导致婴儿睡眠质量的降低。
母亲的身体状态包含了年龄、婚姻状况、教育程度、妊娠时间、分娩方式,而心理
状态则包括了分娩相关创伤后应激障碍情况( CBTS )、产后抑郁情况( EPDS )、住院
期间的焦虑和抑郁水平情况( HADS ),探究母亲身心健康情况与婴儿睡眠质量的关系
成为观察影响婴儿成长的方法。
1.2 要解决的问题
要求根据已知的 390 3 12 个月婴儿以及其母亲相关数据,通过相关文献了
解专业背景,进而回答下列问题:
对于问题一,请根据附件中的数据研究母亲的身体指标对婴儿的行为特征和睡眠质
量是否有影响,以及母亲的心理指标对婴儿的行为特征和睡眠质量是否有影响。
对于问题二,安静型、中等型、矛盾型是婴儿的行为特征的三种类型,请根据已知
的婴儿行为特征建立以婴儿的行为特征为因变量,母亲的身体指标与心理指标为自变量
的关系模型,并根据建立的关系模型预测编号 391-410 号这 20 组的婴儿行为特征属于
什么类型。
对于问题三,对母亲心理患病程度的治疗可以促进婴儿的认知、情感和社交发展,
改善婴儿的行为特征,已知母亲三种心理病状的的治疗费用相对于患病程度的变化率均
与治疗费用呈正比,请根据表 1 中患病状况与治疗费用之间的关系,建立在 238 编号的
婴儿行为特征从矛盾型变为中等型的条件下,使得花费治疗费用最少的模型,求出最少
的治疗费用。而当 238 编号的婴儿行为特征变为安静型时,同样建立治疗费用最少模型,
得到最少的治疗费用为多少。
对于问题四,已知整晚睡眠时间、睡醒次数、入睡方式是婴儿睡眠质量的指标,请
将已知婴儿睡眠质量指标的数据进行评价得分,并将其分为优、良、中、差四个等级。
再根据分类得到的婴儿综合睡眠质量,建立其与母亲的身体指标、心理指标之间的关联
模型,并根据建立的模型预测编号 391-410 20 组婴儿的综合睡眠质量。
对于问题五,在问题三建立的治疗费用最少模型基础上,添加 238 号婴儿的综合睡
眠质量为优的约束条件,求解出最少的治疗费用。

二、问题分析

2.1 问题一的分析
问题一要求分析母亲的身体指标和心理指标是否对婴儿的行为特征和睡眠质量存在影
响。考虑到母亲的身体指标有 4 个变量,心理指标、睡眠质量均有 3 个变量,则先利用主成
分分析法进行降维,再分析变量间是否存在相互关系,从而达到简化题目的效果。接着对数
据进行正态性检验,又样本值为 380 ,远小于 5000 ,为小样本数据,因此选择 S-W 检验。
若结果表明呈现正态分布,则使用 Pearson 相关系数;反之,则使用 Spearman 相关系数。
最终通过相关性分析判断 母亲的身体指标和心理指标是否对婴儿的行为特征和睡眠质量
存在影响。

2.2 问题二的分析
问题二要求建立以婴儿的行为特征为因变量,母亲的身体指标与心理指标为自变量
的关系模型,并根据建立的模型预测 20 ( 编号 391-410 ) 的婴儿行为特征类型。显然
建立分类模型去预测婴儿特征类型。因此本文考虑使用有序逻辑回归模型进行预测。首先
针对婴儿行为特征的分布状况以进行描述,判断是否需要对样本进行采样。接着对模型
进行似然检比卡方检验,分析似然检比卡方显著性,若 P<0.05 ,说明模型有效,反之模
型不成立。接着计算回归系数,再根据因变量阈值表,得到最终的有序逻辑回归模型。
结合混淆矩阵与准确率,对模型进行评估。并通过建立的有序逻辑回归模型得到最后 20
组的分类结果。
2.3 问题三的分析
问题三要求根据表 1 中患病状况与治疗费用之间的关系,建立在 238 编号的婴儿行
为特征从矛盾型变为中等型和安静型的条件下,使得花费治疗费用最少的模型,求出最
少的治疗费用。首先患病程度的变化率与治疗费用的正比关系建立每个心理指标与治疗
费用之间的关系,然后求和得到总治疗费用与 3 个心理指标间的关系,其次引入上四分
位数与下四分位数作为每一种婴儿行为特征的边界范围,求解出每一种婴儿行为特征所
对应心理指标的取值范围,接着以
的患病程度变化率为决策变
量,每种婴儿行为特征的边界以及问题二中求得处于中等型和安静型行为特征的方程作
为约束条件,总治疗费用为目标函数,建立婴儿行为特征约束的单目标最值优化模型,
并运用智能算法进行求解,得到婴儿行为特征从矛盾型变为中等型和安静型的最少治疗
费用。
2.4 问题四的分析
要求根据整晚睡眠时间、睡醒次数、入睡方式三种指标对婴儿的综合睡眠质量进行
评判分类,以分类的结果数据建立与母亲的身体指标、心理指标的关联模型。由于睡眠
质量的三个指标可以通过查阅文献以及直观的得出其为正向或负向指标,同时也能得到
影响睡眠质量指标的三个最优值,在本题数据量较小,数据的质量程度不高的情况下,
可以采用简单的评价模型对每一组编号进行评价,从高到低得到评价分数,并根据评价
分数按照一定占比简单分类,即可得到婴儿睡眠质量的综合评判结果。接着对睡眠质量的
评判结果量化,将优、良、中、差分别量化为 3 2 1 0 。然后建立多种机器学习模型伯明
并对其进行评估,最终选择建立最优的一个机器学习分类模型,预测最后 20 组婴儿的综合
睡眠质量的类别。
2.5 问题五的分析
问题五要求在问题三建立的治疗费用最少模型基础上,添加 238 号婴儿的综合睡眠
质量为优的约束条件,求解出最少的治疗费用。首先同样引入上四分位数与下四分位数
作为婴儿优质睡眠质量的边界范围,其次在问题三模型的基础上,将引入的优质睡眠质
量的边界范围作为约束条件加入到模型中,最后通过智能算法求解得到婴儿行为特征从
矛盾型变为中等型和安静型,同时睡眠质量变为优时的最少治疗费用。

三、模型的假设

1 )假设每一类的行为特征中心理指标的边界可用上四分位数与下四分位数代替;
2 )假设母亲一旦进行心理治疗,无论有没有降低患病得分都必须缴纳三种病症的门
槛费用 1000 元;
3 )假设 **

四、符号说明

五、模型的建立与求解

本文先对数据进行预处理,再进行模型的建立与求解。
首先对问卷进行异常值处理。编号 43 、编号 95 、编号 134 、编号 196 、编号 301
编号 308 、编号 355 位受访者的婚姻状况为 3 ;编号 231 、编号 306 位受访者的婚姻状况
6 。而婚姻状况仅为两类 (1 2) ,即已婚和未婚,故删去编号 43 、编号 95 、编号 134
9 个观测值。又编号 180 位受访者的为 99:99 ,显然记录或手机有误,为无效问卷,
故删去编号 180 。因此总共剔除数据 10 个,有效问卷共 380 份,属于正常范畴。
接着,本文对变量进行量化处理。婴儿行为特征指标进行量化,分别将安静型、中
等型、矛盾型赋值为 0 1 2 。其次,将整晚睡眠时间(时:分:秒)进行量化,即其
将转换为定量变量。如将 5:00:00 转换为数值 5 ,将 5:30:00 转换成数值 5.5
5.1 问题一模型的建立与求解
问题一要求分析母亲的身体指标和心理指标是否对婴儿的行为特征和睡眠质量存在影
响。母亲的身体指标包括年龄、婚姻状况、教育程度、妊娠时间、分娩方式;产妇心理指标
通过三种不同的问卷得分表示,问卷分别为 CBTS EPDS HADS ;婴儿睡眠质量指标包括
整晚睡眠时间、睡醒次数、入睡方式。考虑到母亲的身体指标有 4 个变量,心理指标、睡眠
质量均有 3 个变量,则先利用主成分分析法进行降维,再分析变量间是否存在相互关系,从
而达到简化题目的效果。
相关分析是对变量两两之间的相关程度进行分析。 Pearson 相关系数适用于定量数
据,且数据需服从正态分布; Spearman 相关系数适用于定量变量有序变量,且当数据不
满足正态分布时使用。 因此本题先对数据进行正态性检验,又样本值为 380 ,远小于 5000,
为小样本数据,因此选择 S-W 检验。若结果表明呈现正态分布,则使用 Pearson 相关系
数;反之,则使用 Spearman 相关系数。问题一思路图如下所示:

斯皮尔曼相关关系数值均在 -1 1 之间, 1 表示完全正相关,而 -1 则是完全负相关。由
上图可知母亲的身体指标与婴儿行为特征呈现负相关,而与睡眠质量均呈现正相关。母
亲的心理指标与婴儿行为特征呈现正相关,与整晚睡眠时间呈现负相关,与睡醒次数呈
现正相关。
5.1.3 结果分析
通过斯皮尔曼相关系数分析得到:母亲的身体指标与婴儿行为特征、睡眠质量之间
不存在显著影响,无线性相关性;母亲的心理指标与婴儿行为特征、整完睡眠时间、睡
醒次数之间存在显著影响,存在线性关系。并且母亲的身体指标与婴儿行为特征呈现负
相关,而与睡眠质量均呈现正相关。母亲的心理指标与婴儿行为特征呈现正相关,与整
晚睡眠时间呈现负相关,与睡醒次数呈现正相关。
5.2 问题二模型的建立与求解
首先针对婴儿行为特征的分布状况以进行描述,判断是否需要对样本进行采样。接
着对模型进行似然检比卡方检验,分析似然检比卡方显著性,若 P<0.05 ,说明模型有效,
反之模型不成立。再根据模型参数表,分析 X 是否呈显著性 (P<0.05) ,用于探究是否影
响关系。结合预测分类混淆矩阵与模型评价中的分类指标,分析模型预测。并得到最后
20 组的分类结果。
5.2.1 建立有序逻辑回归模型
Step 1 因变量分布状况的简单描述统计
当婴儿行为特征分类水平的数据量出现严重不平衡时,则需对数据进行过采样或者
欠采样。下表展示了因变量各分组的分布情况。类别总计 0 1 2 三种,分别代表安静
型、中等型、矛盾型。安静型频数为 116 ,百分比为 30.526% 。中等型频数为 220 ,占比
57.895% 。矛盾型频数为 44 、占比为 11.579% 。分布相对均衡,且数据集样本量较少,
若再采样,样本量更少,影响模型质量。

5.3 问题三模型的建立与求解
题目要求在已知患病得分与治疗费用的关系基础上,求解使得 238 号婴儿行为特征
从矛盾性变为中等型和安静型,治疗费用最少的情况。首先可以去表 1 的已知条件拟合
出患病程度的变化率与治疗费用的关系,由拟合的方程求和得出总治疗费用,然后由每
种婴儿行为特征中心理病状得分的上四分位数与下四分位数作为每种婴儿行为特征的
边界,以总的治疗费用作为目标函数, CBTS
HADS 三种心理病状的变化率作
为决策变量,每种婴儿行为特征的边界以及问题二中求得处于中等型和安静型行为特征
的方程作为约束条件,通过智能算法进行求解得到婴儿行为特征变为相应的情况下,所
需的最少治疗费用,具体流程图如下所示:

六、模型的评价与推广

6.1 模型的优缺点
6.1.1 优点
(1) 婴儿行为特征有一定的顺序性,有序逻辑回归模型适合处理有序分类变量,能
够更好地利用不同类别之间的顺序信息。简单直观、预测能力强,可解释性强。并且该
算法相对简单。
(2) 灰色关联度模型具有将强的适应性、灵活性,结果的直观性和解释性都较强。
(3) 随机森林分类模型,适用于处理复杂非线性问题,适 应各种数据分布。对大规模数
据集和高维特征有良好的扩展性,在不平衡数据集上同样也具有较好的性能。
(4) 规划模型精确性高、效率高、可复用性强:数学建模规划模型可以精确地描述实际
问题,能够得到较为精确的结果;规划模型可以通过数学优化算法高效地求解问题,节省人
力和时间成本;已经建立的数学建模规划模型可以在类似问题中复用,减少重复工作。
6.1.2 缺点
有序逻辑回归模型: 需要大量的训练数据。
规划模型:对问题的复杂性有一定要求,可能无法完全覆盖实际情况,求解过程相
对困难。需要大量数据进行参数估计和模型验证。
6.2 模型的改进与推广
6.2.1 模型的改进
分类模型可利用特征工程或设计损失函数进行模型改进。针对具体问题,选择不同
的改进方法。也可以进行模型融合,将有序逻辑回归与其他分类模型进行组合,从而提
高分类质量。
规划模型可以通过增加数据进行模型改进,从而提高模型的精确性、可解释性。也
可通过建立完善的评估指标和评估方法,对模型进行全面的评估和调优,确保模型在各
种情况下都能产生高质量的规划结果。
6.2.2 模型的推广
分类模型可解决许多不同领域的问题,如信用评分和风险预测、市场营销和消费行
为、车辆识别、医学图像分析、文本分类和请按发现等。
规划模型也主要用于建立和预测变量之间的关系,可解决生产和物流规划、项目管
理和资源分配、资源的分配和任务的优先级、排班和员工调度、能源管理和优化、城市
和交通规划、市场需求预测和库存管理、基础设施规划和优化。从而最大程度地满足人
们的需求,最优化项目进度和资源利用,并提高社会效益。

七、参考文献

[1] 何晓群 . 多元统计分析 . 北京:中国人民大学出版社, 2012.
[2] 徐维超 . 相关系数研究综述 [J]. 广东工业大学学报 ,2012,29(3):12-17.
[3] 张俊艳 , 余敏 . 基于有序逻辑回归的标准必要专利价值影响因素研究 [J]. 电子科技大
学学报(社会科学版) ,2018,20(1):15-19.
[4] 刘卓娅 , 郭玉琴 , 宋娟娟 , . 婴幼儿入睡方式及其对睡眠质量的影响 [J]. 中国当代
儿科杂志 , 2022, 24(3): 297-302.
[5] 陈孝颖 . 某三甲医院 1 11 月龄婴儿睡眠现况及影响因素研究 [D]. 南昌大学 , 2022.
[6] 周志华 . 机器学习 [M]. 北京:清华大学出版社 , 2016.

八、附录

;