Bootstrap

2022华为杯研究生数学建模赛题思路分析

已更新BEF具体思路,更多思路在文末名片

A题思路(华为题):移动场景超分辨定位问题

A题是一个移动场景下通过信号波定位的问题,这里我们需要用到调频连续波雷达FMCW,给大家解释一下FMCW,调频就是指雷达发射信号的频率随时间变化,连续波是指雷达发射信号的波形在时间上连续。

原理

如上图,实线表示发射信号,虚线表示接收信号。

B - 扫频范围

Fb - 差频

τ- 回波的延迟

T- 发射周期

雷达的组成

A题难度比较大,需要用到非常多的数学公式,要求数学功底较强,新手不考虑

B题思路(华为题):方形件组批优化问题

子问题1排样优化问题。要求建立混合整数规划模型,在满足生产订单需求和相关约束条件下,尽可能减少板材用量。

约束:

  1. 在相同栈(stack)里的产品项(item)的宽度(或长度)应该相同;
  2. 最终切割生成的产品项是完整的,非拼接而成。

本子问题要求编程,以数据集A为输入,输出结果要求见第五部分。

子问题1的思路:

首先观察并分析数据(A1-A4, A5删掉不考虑,官方已通知),每个excel表中材料相同,目标为给出板材的切割方案。

根据第3条假定,排样方式为精确排样且切割段数不超过三,子问题中还要求相同栈里产品宽度或高度相同,所以很容易想到将数据中具有相同长度或宽度的部件进行合并,排列成更大的部件组合作为一一个栈,比如这三个部件:

224

397

224

378

224

378

他们宽度相同,将其组合成224*1153的一个大块部件作为一个栈,然后这个栈再加上一些冗余,比如224*1160,注意得保持宽度不变,之后再合并类似的不同栈组成更大的条带,以满足条带的长度恰好是板材的长或宽,不同条带再一次组 合直到匹配原材料的长宽。

总共组合三次,每次都可以加上适当冗余,最后能精确匹配原材料版的长宽。这样的划分可符合题目要求。对于三阶段约束排样算法,有精确算法(如线性规划,动态规划,整数规划和分支定界法等)和启发式算法(遗传算法,模拟退火算法等)两种,可根据实际数据量大小进行选择。

然后如何鉴定这切分的优秀程度呢?可用有效利用率表示,利用率即为所有部件面积和除以所用的所有原料面积和,越高越好。

首先确定极限利用率,即理论最少需要多少板材,如A1中所有部件面积和为284万平方米,需要83.54块2440* 1220的原材料板,即至少需要84块版,那么极限利用率为99.45%,因此划分后利用率越接近99.45越好(理论不可能超过),当然这个,上限还能再降低,比如A1数据中有2418*58的部件,由于原材料版最长边为2440且没有小于22的部件可用,因此这种部件放入版中必然会有22*58的面积损失,如果考虑这种情况还可以进一步降低上界。

最底层的算法是几何算法,可以采用左底策略等放置部件,通过不同策略选择最优的元件放置到矩形中。

随机化方法和智能优化算法,则要处理排放矩形的顺序,可以使用各种规则,比如面积大小排序,周长,宽度,高度,综合等等,然后还要组织选择搜索策略。往往需要快速找到一个局部范围内的较优解,然后慢慢搜索到更好的全局解。

以遗传算法为例:

首先将长或宽相同的部件进行分组,遗传算法以整数编码(编码方式不唯一-,比如:每个部件有组号和组内序号,正数表示横放,负数表示竖放等等),解码时根据整数排列顺序组合相邻的部件为更大的部件,然后将不同部件拼合,计算出利用率等。

子问题2订单组批问题。要求建立混合整数规划模型,对数据集B中全部的订单进行组批,然后对每个批次进行独立排样,在满足订单需求和相关约束条件下,使得板材原片的用量尽可能少。

在满足子问题1约束的基础上进一步要求:

  1. 每份订单当且仅当出现在一个批次中;
  2. 每个批次中的相同材质的产品项(item)才能使用同一块板材原片进行排样;
  3. 为保证加工环节快速流转,每个批次产品项(item)总数不能超过限定值;
  4. 因工厂产能限制,每个批次产品项(item)的面积总和不能超过限定值;

本子题要求编程,以数据集B为输入,输出结果要求见第五部分。

子问题2的思路:

子问题2的数据量达到109218条,我们需要做的是根据题目要求完成组批,组批需要满足以下限制:

单个批次产品项(item)总数上限max_ itemn_ _num = 1000

单个批次产品项(item) 的面积总和上限max_ item_ area = 250 (m2)

根据产品项数量粗略估计,至少需要110个批次。

我们要寻找需遵循的组批原则。题目背景中提到:组批批次太小,材料利用率低,生产效率低;如果组批批次太大,材料利用率会提高,但订单交货期得不到保证,订单分拣难度提高,生产效率降低。

假定我们已有一种组批策略,需要建立一个可以量化组批合理性的模型,可以使用批次内批次内产品项数/单批次产品项总数上限和批次内产品面积/单个批次产品项面积总和上限这两个指标进行评价。

那么组批策略如何产生呢,可以建立整数规划模型,在数据处理的基础上(将item按照相同材质、大小--致的汇总)使用启发式算法,如遗传算法等进行求解。

可以尝试多种组批策略,分别计算所用板材原片的数量,选取最小的作为最优解。

C题思路:汽车制造涂装-总装缓存调序区调度优化问题

C题是一个优化调度问题,由于各车间的约束不同导致生产调度无法按照同一序列连续生产,题目中给出了不同的约束条件和相关的时间数据说明,调度优化问题由于是在等式或不等式约束条件下求性能指标的约束,在计算量上是NP完全问题,随着问题规模的增大,对于求解最优化的计算量呈指数倍增长。

本题我们可以将其简化为一个数学规划模型,通过运行仿真程序收集数据,侧重对系统中运行的逻辑关系的描述,对生产调度进行比较评价。

也可以考虑排队网络模型、模拟退火算法、启发式图搜索法等算法进行求解分析。总体难度相对AD题容易些,新手也可以适当考虑。

D题思路(中兴题):PISA架构芯片资源排布问题

D题属于芯片的排布问题,通信、芯片专业如果对口可以考虑下,整体题目难度较大,新手不建议考虑

E题思路草原放牧策略研究

问题1. 从机理分析的角度,建立不同放牧策略(放牧方式和放牧强度)对锡林郭勒草原土壤物理性质(主要是土壤湿度)和植被生物量影响的数学模型。

问题1可简化为放牧方式与放牧强度对土壤湿度与植被生物量的影响。

我们要构建的模型自变量为:

1、放牧方式:根据题干有全年连续放牧、禁牧、选择划区轮牧、轻度放牧、生长季休牧五种,其中禁牧与轻度放牧与放牧强度中的两项含义重复,因此不需要额外考虑;此外,策略对草原的影响强调的是时间上的影响,空间上的影响体现在草原的固有性质中,因此,作为自变量的放牧方式实际上只需要考虑两种:全年连续放牧以及分时放牧。为简化模型,该变量在模型中可作为一个比例系数体现。

2、放牧强度:该变量可以直接用一常数S表示,S为每平方米牧羊数。注意这里的“羊”只是一个牲畜单位,牛、马、骆驼=6羊,牛、马、骆驼的幼崽=3羊,羊羔=0.5羊。

模型的因变量为:

1、土壤湿度的变化 dh/dt:其中h表示湿度,而我们作为模型输出的是h随时间的变化,因此需要对时间做微分,植被量相同。

2、植被生物量的变化dw/dt:其中w表示植被生物量。注意:植被生物量数据为附件15中的干重,不要与附件5、6、10中的数据混淆。

针对放牧强度对植被变化的影响可直接套用拓展阅读中的公式:

针对放牧强度对土壤湿度的影响可结合附件3土壤湿度、附件4土壤蒸发数据附件8降水、附件的数据。由于影响土壤湿度的因素只有土壤蒸发、降水以及放牧情况,因此去除土壤蒸发及降水影响(这两项由附件已知)后,剩下的就是放牧情况对土壤湿度的影响。

由附件15中的植被生物量数据结合刚刚提到的方面与植物生长之间的关系式可以反推放牧情况,由此,我们可以得到放牧情况对勿让湿度的影响。

考虑到分时放牧,我们最后为模型输出加上一个比例系数即可。

问题2. 请根据附件3土壤湿度数据、附件4土壤蒸发数据以及附件8中降水等数据,建立模型对保持目前放牧策略不变情况下对2022年、2023年不同深度土壤湿度进行预测,并完成下表。

由问题1可知,目前的放牧策略可由植被生物量反推,而放牧策略对土壤湿度的影响在问题1中已经获得,由此直接套用问题1中的模型即可。

注意做这题不要被拓展阅读中复杂的公式影响:

我们只需将E(α)整体作为已知量即可。

问题3. 从机理分析的角度,建立不同放牧策略(放牧方式和放牧强度)对锡林郭勒草原土壤化学性质影响的数学模型。并请结合附件14中数据预测锡林郭勒草原监测样地(12个放牧小区)在不同放牧强度下2022年土壤同期有机碳、无机碳、全N、土壤C/N比等值,并完成下表。

这一小问比较简单,直接用附件14中的数据套用回归模型即可。针对每一项化学性质单独设计一个回归模型,分别调参。由于数据量与特征量有限,这里比较建议用决策树模型。

问题4.利用沙漠化程度指数预测模型和附件提供数据(包括自己收集的数据) 确定不同放牧强度下监测点的沙漠化程度指数值。并请尝试给出定量的土壤板结 化定义,在建立合理的土壤板结化模型基础上结合问题3,给出放牧策略模型, 使得沙漠化程度指数与板结化程度最小。

问题4分为两个小问,其中第一小问沙漠化预测模型已在拓展阅读中第3条中详细给出,不再展开分析。现在看第2小问。

已知板结化公式为:

B = f(W,C,O)

土壤湿度w越少,容重c越大,有机物含量O越低,土壤板结化程度B越严重。 其中土壤湿度数据在附件3中,有机物含量在附件14中,容重在附件7中(是一个常量)。该模型可具体表示为:

这里主要是根据三个因素的影响程度确定三个系数之间的比例。题目所给数据没有衡量这一指标的明显特征,因此对系数的确定言之有理即可。

结合问题3中放牧策略对O的影响可进一步得到放牧策略对B的影响,再结合沙漠化程度预测模型可得到最佳放牧策略。

F题思路:COVID-19疫情期间生活物资的科学管理问题

问题一:各种生活物资的大规模流动方式对疫情的影响

不少城市的疫情在短时间内无法得到快速控制,反思其原因,有一种观点认为疫情的发展或被控制扑灭与生活物资发放方式有关。请结合附件1中所提供的长春市COVID-19疫情期间病毒感染人数数据及其它附件数据或你们能搜集到的数据对长春市实行发放蔬菜包前后效果进行判别与分析,以利今后的防控工作。

思路分析:首先是问题一,主要是分析蔬菜包发放对长春市疫情控制的影响,蔬菜包的数据在附件4中有,但具体何时开始发放蔬菜包,这个需要查阅更早的数据,如果实在查不到可以以附件4的数据为主,此时将疫情感染人数数据分为蔬菜包发放前数据和发放后数据然后进行展示,若呈现倒V字形则表示蔬菜包的发放对抑制疫情的发展有良好的作用。这里注意包括分区讨论和整个长春市的数据讨论两部分。若需要建立模型的话,可以建立蔬菜包发放数据和疫情感染人数等数据之间的关系式。

问题二:生活物资投放点数量与位置问题

在疫情爆发初期长春市的生活物资主要通过若干个投放点进行发放。考虑到在疫情初期既需要大量的人力资源又同时要求尽量减少人员流动、接触,投放点的数量显得尤为重要。在附件2中提供了当时长春市不同区域投放点数量分布结果。请结合附件3中和附件4中有关数据,讨论投放点数量的合理性,并通过数学建模进行适当的优化。另外,请充分考虑未来疫情、自然灾害等特殊事件,对于政府储备物资和大规模物资分拣场所的位置与数量规模进行合理规划,并提出最优的选址数量、规模及其潜在的备用场所位置。

思路分析:问题二主要分为两个小问,前者是讨论数量的合理性,合理性的关键就是该数量能否保障隔离区人口的物资保障,但由于并不知道投放点的位置和人员的配置及每天该投放点的物资比例,所以我们只需要单纯的讨论数量即可;数量的划分主要与隔离区人数、路网的密度、小区的数量等因素有关,这是因为理论上路网越密集造成交通拥堵的可能性越大,此时就需要多设置投放点;同样小区数量越多则寻找起来越负责,也应该设置更多的投放点,因此将问题转化为需要建立投放点数量与路网信息、隔离人数和小区数量等指标的关系,可以先根据问题一中的分析找出那些区域经过蔬菜包投递后感染人数降低的数量是最明显的,然后基于该数据建立投放点数量与后三者之间的方程,基于该方程对剩余区域进行求解和优化即可。后面这一小问为一个选址问题,类似的方法非常多,主要是建立合适的优化模型即可,这里可以私信学长提供类似的选址建模方法,优化模型主要是包括三部分,决策变量、目标函数和约束条件,其中决策变量在这里就是选址的位置坐标信息以及最少的数量,所以可以看做是一个多目标优化问题;目标函数就是到达各区的距离要最近等。

注:请务必将相关结果以表格的形式放置在正文中,其中主要参数包括选址 位置及所属区域、选址半径、管辖范围小区个数及管辖范围内人口数等关键信息应该体现在表格中。

问题三:生活物资的科学发放问题

在疫情期间生活物资的发放过程中蔬菜作为一类人们急需且保质期较短的特殊产品,其分配的效果比较重要。长春市经过一段探索发现蔬菜包形式既减轻本市志愿者的数量与工作量又减少人员对蔬菜的接触。请依据附件5分析蔬菜包需求、发放规律,并根据附件3中的各小区位置与人口信息,评价并调整4月10日至4月15日蔬菜包供应方案。

思路分析:问题三主要是先通过附件5分析规律,然后再对4月10日至15日数据进行 调整。首先应该先确定一下釆购量与发放量之间的关系,这个关系不能用简单的回归分析来构建,这是因为两者并不是一一对应的关系(存在库存关系),因此 要想得到两者之间的真实逻辑关系则需要进行动态分析,先将每天各区域的釆购 量和发放量数据整理好,然后分别建立采购量和发放量的预测模型,这里预测模 型不建议釆用灰色预测,这是因为数据并非呈现单调关系,可釆用二次指数平滑或ARMA算法等,预测出规律后再对4月10号至15号数据进行预测,预测完成 后结合附件3数据进行动态调整即可

问题四:为长春市做好大规模封控情况下居民生活物资有序发放预案

长春市三月的疫情虽然安全扑灭,但未雨绸缪,请你们在第二、三问的基础上,结合附件3给出的长春市街道和小区情况的表格,做出特殊时期保障居民生活物资供应的详细预案(有序网络图)。网络上游是各项物资来源(每个区选一个地点,参赛队可自行根据坐标选择),中游是各项物资的集散地(集散地数量自行选择,可以先按附件2设置,再调整优化),网络下游是长春市所有小区。物流是一个周期内各天通过网络各条边所运输的各项生活物资的数量(开始可以只考虑蔬菜,不同日期可以发送不同品种蔬菜以增加居民的蔬菜品种)。开始时,网络的各条边可以不使用真实的街道,认为两点之间由最短路连接。后来可以选择少数行政区按真实街道选择路线,直至全市。由于是特殊时期,所以节省人力(工作量按运输里程与小区居民人数乘积计算)是最重要的指标,同时希望减少人员的直接、间接接触。在完成有序网络图后请进一步考虑用卡车运送物资,大卡车每辆可装10吨,小卡车每辆可装4吨,观察预案有无显著不同。

注:请以图形或表格的方式精简地将相关结果在正文中表述出来,并请对照指标分析与评价你们给出的发放预案的优势。

问题四主要是根据前面建立的各类模型给出系统的方案即可,这里主要包括每个区域选一个物资集中地、对中游的生活物资投放点进行选址和优化,所以该问题还是一个优化问题,其中可以先对中游物资投放点进行优化,数量可以釆用附件二数据,位置需要根据路网信息和小区数据进行选址,模型这里可选择的非常多,投放点选择完成后在选择物资来源地的选址,思路是一样的,只要该地点到各投放点的距离最近即可。

注:请以图形或表格的方式精简地将相关结果在正文中表述出来,并请对照指标分析与评价你们给出的发放预案的优势。

本次比赛也会为大家提供一系列的资料,下方名片↓

;