摘要
我们研究了一种基于重叠线性决策规则的简单近似方案,用于解决具有类型∞ Wasserstein 模糊集的数据驱动的两阶段分布鲁棒优化问题。
我们的主要结果表明,这种近似方案对于两阶段随机线性优化问题是渐近最优的; 也就是说,在温和的假设下,随着数据点的数量增长到无穷大,通过近似稳健优化问题获得的最优成本和最优第一阶段决策会收敛到潜在随机问题的最优成本和最优第一阶段决策。 这些保证特别适用于没有相对完整的追索权的两阶段随机问题,这些问题在应用中经常出现。 在这种情况下,我们通过数值实验表明,近似方案实际上是易于处理的,并且产生的决策明显优于从最先进的数据驱动替代方案中获得的决策。
1 引言
不确定性下的动态决策,即随着时间的推移做出决策并揭示不确定性,构成了运筹学、控制理论和计算机科学中无数应用的基础。 包含许多这些决策问题的突出框架是两阶段随机线性优化。 该框架由 Dantzig (1955) 和 Beale (1955) 引入,用于解决在不确定性下做出初始决策的问题设置,然后揭示随机变量,然后选择第二阶段决策。 两阶段随机线性优化的持久研究可归因于其在现代运营应用中的流行,例如库存管理、网络设计和能源规划(Birge 和 Louveaux 2011)。
解决这些优化问题的一个核心挑战是随机变量的概率分布在实践中很少为人所知。 因此,许多研究工作都集中在开发利用历史数据为具有未知分布的两阶段随机线性优化问题找到接近最优解的方法。 在这种情况下,也许最著名的两阶段随机线性优化的数据驱动方法是样本平均近似 (SAA)。 简而言之,SAA 通过解决两阶段随机线性优化问题来找到第一阶段决策,其中真实分布被历史数据的经验分布代替; 见夏皮罗等人。 (2009 年,第 5 节)。
两阶段随机线性优化的 SAA 方法提供了几个吸引人的特性。
一方面,SAA 可以完全解决为具有大小(决策变量和约束的数量)的线性优化问题,它在数据点的数量上呈线性比例。 此外,SAA 在温和的概率假设下是渐近最优的,这意味着当数据点的数量趋于无穷时,SAA 产生的最优成本和最优第一阶段决策可以保证收敛到潜在随机问题的那些(Shapiro 2003,Robinson 1996 年,金和韦茨 1991 年)。
然而,当面对有限的历史数据时,SAA 在两阶段问题中的吸引力可能会降低。 在单阶段和两阶段问题中,当数据点的数量是有限的时,SAA 的最优成本将产生对随机问题成本的不希望的乐观偏差估计; 参见,例如,Van Parys 等人。 (2017)。 更重要的是,为了确保 SAA 的第一阶段决策具有可行的第二阶段决策,可能需要不切实际的大或无限数量的数据点(Nemirovski 和 Shapiro 2006,第 3 节)。 没有相对完整的追索权的两阶段问题,即第二阶段问题并不总是可行的问题,在实践中经常发生并且“在许多应用中是规则而不是例外”(Nemirovski and Shapiro 2006, 第 16 页)。
为了从有限的数据中获得更好的两阶段随机线性优化近似值,最近的工作研究了 SAA 的增强,其中将对抗性噪声添加到数据点。 这些方法通常被表述为分布稳健的优化问题,其中最优的第一阶段决策是在对抗性选择的概率分布下表现最佳的决策(Wiesemann et al. 2014, Delage and Ye 2010)。 通过限制对手选择在某种意义上与历史数据接近的概率分布,越来越多的证据表明,与两阶段分布稳健优化产生的第一阶段决策相比,可以具有更好的平均样本外性能 到 SAA 生产的那些(Hanasusanto 和 Kuhn 2018,Jiang 和 Guan 2018)。
不幸的是,在两阶段问题中,分布式鲁棒优化的潜在好处通常会因计算成本的增加而受到阻碍。 与通常可以作为线性优化问题解决的两阶段问题中的 SAA 相比,两阶段鲁棒优化和两阶段分布鲁棒优化与基于 Wasserstein 的歧义集被证明是 NP-hard (Feige et al. 2007, Hanasusanto and Kuhn 2018)。 因此,使用数据驱动的模糊集来解决两阶段分布鲁棒优化的近似算法的开发已成为研究的中心焦点。 Hanasusanto 和 Kuhn (2018) 展示了带有 Wasserstein 模糊集的两阶段问题,可以使用共正优化精确地表述,这可以使用半定优化来近似。 陈等人。 (2020 年)提出了使用 Wasserstein 和 k-means 模糊集解决两阶段分布鲁棒优化的基于事件的适应,Jiang 和 Guan(2018 年)研究了使用 phi 散度模糊集解决两阶段分布鲁棒优化的采样方法。
在本文中,我们研究了一类基于 Wasserstein 的两阶段分布鲁棒优化问题的解决方法,旨在优雅地保留 SAA 的有吸引力的属性(可扩展性和渐近最优性)。 特别是,该方法可以作为线性优化问题轻松解决,并保证在温和假设下渐近收敛到随机问题。 因此,我们认为该方法为在两阶段问题的背景下弥合分布式鲁棒优化和 SAA 的相对优点提供了一个有吸引力的步骤,特别是那些没有相对完整的追索权的问题。 更详细地说:
• 我们考虑一种解决方法,称为多策略近似,用于使用类型∞ Wasserstein 模糊集解决数据驱动的两阶段分布鲁棒优化。 该方法通过优化重叠决策规则形成了这些稳健问题的近似值,每个数据点周围的每个不确定性都有一个。 我们证明了近似质量保证优于任何传统的决策规则近似(定理 1),并且在线性决策规则的情况下,可以解决为线性或二阶圆锥优化问题(命题 1)。 与 SAA 类似,此优化问题的大小(决策变量和约束的数量)随着数据点的数量线性增长。
• 我们证明具有线性决策规则的多策略逼近对于两阶段随机线性优化是渐近最优的。 也就是说,在温和的假设下,我们表明,从多策略近似中获得的最优成本和最优第一阶段决策几乎肯定会收敛于潜在的两阶段随机线性优化问题,因为数据点的数量趋于 无穷大(定理 2)。 从实践的角度来看,这样的保证提供了保证,随着获得更多数据,使用 ∞ Wasserstein 模糊集以及多策略近似的两阶段分布鲁棒优化的任何偏差或次优性都会消失。
除了上述方法学结果外,我们还提供了数值证据,证明多元近似在实践中也很有吸引力。 首先,在一个没有相对完整资源的两阶段网络库存管理问题中,并且跨越不同的概率分布和不同大小的数据集,我们表明该近似产生的第一阶段决策在可行性上明显优于替代方法产生的决策(与 SAA)和平均成本(与其他分布稳健的优化方法相比)。
其次,在两阶段医院调度问题中,我们证明了该方法与用于两阶段分布鲁棒优化的最先进近似算法的样本外性能与 1 型 Wasserstein 模糊集相匹配。
Bertsimas 等人首先研究了具有类型∞ Wasserstein 模糊集的分布鲁棒优化。 (2018),这类问题被证明等同于多个不确定性集上的鲁棒优化问题。 多个不确定性集上的鲁棒优化问题,我们称之为样本鲁棒优化,也已经在其他设置的文献中进行了研究(Erdoğan 和 Iyengar 2006、2007、Xu 等人 2012)。 在数据驱动的多阶段随机线性优化的背景下,Bertsimas 等人。 (2018) 表明,在某些条件下,样本鲁棒优化对于潜在的随机问题是渐近最优的。 虽然那篇论文表明,这些样本鲁棒优化问题可以通过限制为线性或分段线性决策规则来近似,但它没有分析这些近似的紧密性。
本文在几个重要方面与上述文献不同。 最重要的是,这项工作考虑了一种特殊的近似方案,该方案利用了两阶段样本鲁棒优化问题的独特结构,并证明了当数据点的数量趋于无穷大时,其近似间隙收敛到零。 此外,我们还加强了对具有一般(不一定是轻尾或连续)概率分布的两阶段随机线性优化问题的样本鲁棒优化的渐近行为的理解。 具体来说,我们表明,在与 SAA(定理 2)几乎相同的假设下,两阶段样本鲁棒优化是渐近最优的。
鉴于上述讨论,本文的目的不是从性能保证的角度激发基于 Wasserstein 的两阶段分布鲁棒优化,而是提出一种可扩展且渐近最优的逼近方案来解决此类问题 问题。 对于感兴趣的读者,在附录 D 中,我们回顾了现有的概率性能保证,用于使用类型-∞ Wasserstein 模糊集进行分布式鲁棒优化。 使用这些结果,我们还在其中展示了一个程式化的示例,其中从具有类型-∞ Wasserstein 模糊集的分布鲁棒优化获得的第一阶段决策将证明优于 SAA 获得的决策。
本文的近似方案和渐近最优性保证的一个理想特征是它们适用于两阶段样本鲁棒优化问题,其中关于随机变量支持的部分知识通过多面体集合 Ξ ⊆ R d 结合。
决策者可以使用集合 Ξ ⊆ R d 来合并先验知识,从而消除会导致鲁棒优化问题过于保守的荒谬场景。 例如,决策者可以使用这个集合来整合交通网络中的容量将是非负的(例如,示例 1)或需求不会超过上限(例如,第 5.1 节)的先验知识。 重要的是,为了使两阶段样本鲁棒优化问题变得可行,这些先验知识的结合可能是必不可少的,如示例 1 所示。在本文的早期版本在线传播后,谢的后续工作 (2020) 提出了在 Ξ = R d 的情况下使用类型-∞ Wasserstein 模糊集的两阶段分布鲁棒优化的重新表述和复杂性结果。
独立于我们的工作,陈等人。 (2020)考虑了一种类似的事件自适应算法,用于一类具有事件模糊度集的分布式鲁棒优化问题。 相反,他们没有分析这种方法是否或何时是渐近最优的。 在本文中,我们提出并分析了使用 ∞ Wasserstein 模糊集的两阶段分布鲁棒优化的多策略逼近方法,Chen 等人最初并未考虑这种方法。 (2020 年)。 通过利用此类问题的局部结构,我们首次证明了具有线性决策规则的多策略逼近是渐近最优的(定理 2),包括对于没有相对完整资源的问题。
我们的论文的结构安排如下。 第 2 节介绍了两阶段线性优化的样本鲁棒优化方法。 第 3 节针对两阶段样本鲁棒优化问题提出了使用线性决策规则的多策略逼近方案,并分析了其易处理性。 第 4 节确定了多策略逼近方案的渐近最优性。
第 5 节介绍了计算实验。 我们在第 6 节结束本文。
符号 我们用粗体小写和大写字母表示向量和矩阵,例如 x ∈ R n 和 T ∈ R m×n 。 对于任何整数 N ∈ N,我们让 [N ] 是集合 { 1, . . . , N } . y(·) 形式的所有函数的空间: R d → R r 由 R d,r 给出。 以向量 ẑ ∈ R f 为中心的半径 ≥ 0 的闭球记为 B(ẑ, ) , { z ∈ R f : k z − ẑ k ≤ } , 其中 k·k 指代任何 p - 范数,k · k ∗ 是它的对偶范数。 对于任何非空凸集 S ⊆ R f ,它的相对内部是 ri(S) , { z ∈ S : ∀ ẑ ∈ S, ∃ λ > 1 : λz + (1 − λ)ẑ ∈ S } 。 给定两个集合 S, T ⊆ R f ,它们的 Minkowski 和是 S + T , { z + z 0 : z ∈ S, z 0 ∈ T } 。 多面体理论的更多符号和结果见附录 A。
2 问题描述
我们考虑以下形式的两阶段随机线性优化问题
(opt)
在实现任何不确定性之前选择第一阶段决策 x ∈ R n ,并且 ξ ∈ R d 是具有潜在概率分布的随机变量。 不失一般性,我们假设第一阶段决策的任何确定性线性约束都嵌入到第二阶段成本函数中。 给定随机变量的第一阶段决策和实现,第二阶段成本由下式给出
()
其中 q ∈ R r , T ∈ R m×n , W ∈ R m×r ,约束的右侧是 h(ξ) = h 0 + Hξ ∈ R m 形式的仿射函数。 按照标准约定,只要不存在满足其约束的可行第二阶段(追索)决策,上述线性优化问题的目标值就等于无穷大。
我们在本文中假设随机变量的概率分布和支持是未知的。 相反,我们唯一的信息由历史数据 ξ 1 组成。 . . , ξ N ∈ R d ,它们是基础随机变量的独立且相同的分布样本,以及多面体集 Ξ , { ζ ∈ R d : Gζ ≥ g 0 },它是随机支持的保守超集 变量,即 P(ξ ∈ Ξ) = 1,其中 G ∈ R m̃×d 和 g 0 ∈ R m̃ 。 在本节末尾可以找到关于支持的保守超集的进一步讨论。
在本文中,我们研究了以下数据驱动的问题解决方法 (OPT)。 给定历史数据,我们首先构建多个不确定性集,一个围绕每个历史数据点。
然后,我们选择一个第一阶段的决策,并通过解决以下鲁棒优化问题来估计随机问题的最优成本 v ∗:
(sro)
直观地说,上述鲁棒优化问题通过对历史数据求平均找到了第一阶段的决策; 然而,每个历史数据点都受到其不确定性集中的对手的干扰。 当不确定性集被构造为以每个数据点为中心并与多面体 Ξ 相交的封闭球时,我们专注于解决问题 (SRO),
()
其中 N ≥ 0 是一个参数,由决策者选择,它控制不确定性集的大小。 在这种不确定性集的构造下,Problem (SRO) 相当于两阶段分布鲁棒优化类型-∞ Wasserstein 模糊集 (Bertsimas et al. 2018, Proposition 3)。
我们观察到问题 (SRO) 在计算上要求精确解决。 实际上,即使在 N = 1 时,评估第二阶段成本 V̂ N SRO (x) 也是 NP 难的,因为它包括在多面体上最大化分段线性凸函数。 1 本文的目的是开发和分析问题的近似算法 (SRO)。
备注 1. 具有这些不确定性集的问题 (SRO) 可以解释为众所周知的样本平均近似 (SAA) 的稳健推广:
(saa)
事实上,对于 N = 0 的特殊情况,我们很容易观察到问题 (SRO) 和问题 (SAA) 是等价的。
备注 2. 从建模的角度来看,决策者可以使用集合 Ξ ⊆ R d 来合并先验知识,从而消除会导致鲁棒优化问题过于保守的无意义场景。 更重要的是,在某些情况下,严格需要结合此类先验知识,以确保问题(SRO)具有可行的第一阶段决策。 我们通过以下示例说明这一观察结果。
示例 1. 考虑容量不确定的网络流问题。 在第一阶段,我们的任务是在 n 个设施中的每一个中选择一个库存水平 x f ≥ 0,目标是满足 m 个目的地中每一个的已知需求 d j ≥ 0。 选择库存水平后,观察设施 i 和目的地 j 之间的容量 ξ ij ≥ 0。 通过从设施转移库存来满足目的地的需求,从设施 i 到目的地 j 的转移数量由第二阶段决策变量 0 ≤ y ij ≤ ξ ij 捕获。 如果存在历史数据点,其中某个边的容量 ξ ij 正好为零,那么问题 (SRO) 对于任何正半径 N > 0 都是不可行的,除非集合 Ξ 对沿这些边的容量强制执行非负性。
3 多策略近似方案
在本节中,我们提出了一种基于重叠线性决策规则的简单近似算法,用于解决问题 (SRO)。 为了激发这种方法,我们从第 3.1 节开始,介绍一个标准的单策略近似。 然后,我们在第 3.2 节中介绍了多策略近似,我们展示了它可以以相似的计算成本获得更好的问题 (SRO) 近似。
3.1 单策略近似
我们观察到问题(SRO)可以等效地表示为单个优化问题,其中追索决策是不确定性的函数:
()
两阶段问题的一种常见近似技术是将 R d,r 限制在我们可以有效优化的较小策略空间内。 更准确地说,令 Π ⊆ R d,r 表示第二阶段追索政策的受限空间。 然后我们通过求解得到问题(SRO)的近似值
(sp)
我们观察到任何对问题 (SP) 可行的第一阶段决策对于问题 (SRO) 都是可行的,并且问题的最优成本 (SP) 提供了问题的最优成本 (SRO) 的上限近似值。
一种策略选择是线性决策规则的空间,表示为
()
已经表明,在许多两阶段鲁棒优化中对线性决策规则的限制会导致易于处理的优化问题(Ben-Tal et al. 2004)。 我们注意到,单策略近似可以应用于除 L 之外的替代受限策略空间,例如 K 自适应性 (Hanasusanto et al. 2015)、有限自适应性 (Bertsimas and Caramanis 2010) 和提升的线性决策规则 (Chen 和张 2009)。 随着可能的策略集变大,单一策略近似与问题 (SRO) 之间的近似差距通常会减小。
尽管它易于处理,但单策略近似有几个弱点。 首先,与问题 (SRO) 相比,问题 (SP) 可能具有更少(如果有的话)可行的第一阶段决策。 这是由于问题(SRO)的一些可行的第一阶段决策,即具有可行的第二阶段追索政策y(·)∈R d,r 的第一阶段决策在限制后可能不再可行 R d,r 到 Π。 其次,单策略逼近的最优成本与完全自适应问题之间的逼近差距可能很大。 表征由单策略近似导致的近似差距仍然是两阶段稳健线性优化的一个活跃研究领域。 重要的是,除非空间 Π 非常丰富,否则我们不期望单策略逼近的目标值收敛到 N → ∞ 和 N → 0 时的潜在随机优化问题。
3.2 多策略近似
受单策略逼近的缺点的启发,我们考虑了一种不同的逼近问题(SRO)的方法。 下面的方法,此后称为多策略近似,使用限制追索策略空间的相同思想。 与单策略近似相比,多策略近似还允许针对不同的不确定性集优化不同的启发式策略。 具体来说,多策略近似使用受限策略族 Π,并优化 N 个资源策略 y 1 (·), 。 . . , y N ( · ) ∈ Π 使得 y i ( · ) 对于第 i 个不确定性集合中的所有可能实现都是可行的。 多策略近似的公式如下:
(mp)
乍一看,多策略逼近与单策略逼近非常相似。
事实上,这两个近似具有相同类型和数量的鲁棒约束,尽管多策略近似具有 N 倍于需要优化的资源策略。 然而,我们很容易观察到,多策略逼近是单策略逼近的推广; 事实上,如果追索政策 y 1 (·), ,这两个问题是相同的。 . . , y N (·) 被限制为彼此相等。 关键的区别在于,多策略近似提供了灵活性,可以为各种不确定性集找到局部最优的追索策略(参见图 1)。
由于多策略逼近是单策略逼近的推广,它永远不会有更多限制。 实际上,单策略逼近的每一个可行的第一阶段决策对于多策略逼近都是可行的,并且多策略逼近的目标值永远不会大于单策略逼近的目标值。 我们现在表明,多策略近似提供了问题(SRO)的有效上近似。 从这一点开始,我们使用符号 V̂ N SP (x) 和 V̂ N MP (x) 分别表示问题 (SP) 和 (MP) 的最优成本,其中第一阶段决策 x ∈ R n (其中 V̂ N SP (x), V̂ N MP (x) 被设置为无穷大,如果第一阶段决策对于各个问题不可行)。
figure 1
定理 1
证明 考虑任何第一阶段决策 x ∈ R n 。 如果 V̂ N MP (x) = + ∞ ,则不等式 V̂ N SRO (x) ≤ V̂ N MP (x) 很容易满足。 否则,假设存在第二阶段决策规则 y 1 (·), 。 . . , y N ( · ) ∈ Π 对于第一阶段决策 x ∈ R n 的多策略逼近是最优的。 对于任何实现 ζ ∈ ∪ N i=1 U N ,让我们定义相应的索引 i(ζ) 为
()
(如果有多个最优指标,选择最小的指标。)我们定义一个新的追索策略 ȳ( · ) ∈ R d,r 为
()
从构造可以看出,元组 (x, ȳ( · )) 对于问题 (SRO) 是可行的。 所以,
()
在所有情况下,我们已经证明不等式 V̂ N SRO (x) ≤ V̂ N MP (x) 适用于所有第一阶段决策 SRO MP MP SP x ∈ R n 。 这立即意味着 v̂ N ≤ v̂ N 。 最终的不等式(v̂ N ≤ v̂ N 和 V̂ N MP (x) ≤ V̂ N SP (x) 对于所有 x ∈ R n )直接来自问题 (SP) 和 (MP) 的定义,从而得出证明。
上述结果表明,问题 (MP) 提供了问题 (SRO) 的有效上近似,并且任何可行的问题 (MP) 第一阶段决策对于问题 (SRO)。 更一般地,定理 1 表明预期性的概念不必适用于两阶段问题中的第二阶段决策变量。 直观地说,在观察到随机变量之后,在两阶段问题中没有未来的不确定性可以预期。
因此,定理 1 表明,通过考虑重叠的决策规则,即使是那些从不确定参数的相同实现中规定相互矛盾的第二阶段决策的规则,也可以获得两阶段问题的有效上近似。 在实践中,重叠的第二阶段决策规则本身并不是一个重要问题:实际上,给定第一阶段决策 x 和随机变量 ξ 的实现,总是可以通过求解线性优化找到第二阶段决策 y 问题,或者通过应用多策略近似找到的第二阶段决策规则之一。
我们通过展示多策略近似发出易于处理的表示来结束本节。 具体来说,使用凸对偶理论,可以将具有线性决策规则的问题 (MP) 重新表述为有限维优化问题。 该证明是拉格朗日对偶的标准应用,因此被省略。
命题 1. 如果 Π = L ,则问题 (MP) 等价于
()
其中 k·k ∗ 是 k·k 的对偶范数,e j 是单位矩阵的第 j 个向量,并且 ĝ i ≡ Gξ i - g 0 ≥ 0。
在这种重新表述中产生的优化问题的类型取决于不确定性集定义中范数的选择。 如果选择的范数是1 或
∞ ,那么重新表述就变成了一个线性优化问题; 如果选择的范数是 2 ,我们得到一个二阶圆锥优化问题。 在这两种情况下,产生的优化问题都有 O(N ) 约束和 O(N ) 变量,并且很容易被各种现成的求解器解决。
4 渐近最优
在本节中,我们证明了两阶段样本鲁棒优化的多策略逼近是渐近最优的。 也就是说,假设随着获得更多数据,N → 0,我们表明具有线性决策规则的多策略逼近的最优成本和第一阶段决策几乎肯定会收敛到底层两阶段随机线性的最优成本和第一阶段决策。 优化问题(定理 2)。 从实践的角度来看,这样的保证提供了保证随着获得更多数据,多策略近似的任何次优性都会消失。 从理论的角度来看,该保证也可以被视为具有吸引力,因为它是在温和的概率假设下建立的,这些假设类似于建立问题的渐近最优性 (SAA) 所需的假设。
我们的主要结果如下: 定理 2. 让以下条件成立:
(1)
此外,令 x̂ SRO N 分别是问题 (SRO) 和 (MP) 的最优第一阶段决策。 那么 { x̂ SRO N } N ∈N 或 { x̂ N } N ∈N 的任何累积点几乎肯定是问题 (OPT) 的最佳第一阶段决策。
在接下来的章节中展示上述定理的证明之前,让我们首先讨论和解释它的必要条件。
条件[A1]表示我们在多策略逼近中选择使用线性决策规则,并且将选择不确定性集的半径随着获得更多数据而减小到零。 这两个条件都是由从业者选择的。 我们注意到这个条件并不排除在观察历史数据后选择{ N } N ∈N 的序列的可能性。
条件 [A2-A3] 是对基础两阶段随机线性优化问题的概率假设。 由于假定随机问题的概率分布是未知的,因此在实践中通常无法验证这些条件。 另一方面,概率条件 [A2-A3] 是标准的,并且与现有的问题 (SAA) 文献一致(参见第 4.3 节)。 我们注意到,任何没有第一阶段决策(n = 0)的问题都可以通过引入虚拟变量和约束(例如,x 1 ∈ R 和 0 ≤ x 1 ≤ 1)轻松修改以满足条件 [A3]。
条件[A4]本质上规定存在一个第一阶段决策,该决策对于任何数据集上具有线性决策规则的多策略逼近都是可行的。 乍一看,这种情况似乎是有限的。 尽管如此,尽管我们努力了,我们仍然无法找到一个实例两阶段随机线性优化,满足 [A2-A3] 和 { x ∈ R n : Q(x, ζ) < ∞ ∀ ζ ∈ Ξ } 6 = ∅ 但不满足 [A4]。 在第 4.1 节中,我们提出了 [A4] 的充分必要条件,并展示了如何应用这些条件的示例。
由于其普遍性,定理 2 可能被视为具有吸引力。 特别是,定理 2 不需要可行的第一阶段决策集的有界性,也不需要多面体 Ξ 的有界性,并且适用于没有相对完全追索权的问题。 因此,我们认为该定理足够普遍,可以涵盖实践中遇到的大量两阶段随机线性优化问题。
本节的提醒组织如下。 在第 4.1 节中,我们更详细地讨论了条件 [A4],并为该条件的成立提供了可验证的充分必要条件。
在 4.2 节中,我们提供并证明了两个中间引理。 在 4.3 节中,我们结合前几节的结果来证明定理 2。
4.1 A4条件的有效性和必要性
在定理 2 中用于为多策略近似建立渐近最优性保证的四个条件中,[A4] 可能是最不透明的。 在本节中,我们提出了 [A4] 的充分(并且在某些情况下是必要的)条件,并在示例中展示了如何使用它们来验证 [A4]。 在建立这些条件的过程中,我们提出了定义 1 和引理 1,它们也将在第 4.2 节和第 4.3 节中使用。
我们的讨论从 [A4] 的以下简单但有见地的充分条件开始: 命题 2。如果存在满足的第一阶段决策 x ∈ R n 和单个线性决策规则 y(·) ∈ L,则条件 [A4] 成立 对于所有 ζ ∈ Ξ,Tx + Wy(ζ) ≥ h(ζ)。
证明。
这个结果直接来自 [A4] 的定义。
直观地说,上述命题表明,如果具有线性决策规则的单策略近似(参见第 3.1 节)对于多面体 Ξ ⊆ R d 中的所有实现都是可行的,则条件 [A4] 成立。 这个充分条件的吸引力在于它可以通过解决稳健的优化问题在多项式时间内进行评估。 2 尽管如此,命题 2 中提出的条件并不是 [A4] 的必要条件。 换句话说,可以构造满足[A4]但不满足的问题实例命题 2 中的条件。为了证明这一点,我们首先提供一个例子,其中命题 2 的条件不成立。 然后,在当前第 4.1 节的末尾,我们将重新审视这个例子,并证明它确实满足 [A4]。
示例 2. 考虑以下问题,其中我们寻求满足的决策规则 y(ζ)
(2)
我们很容易观察到 y(ζ) = | ζ 1 - ζ 2 | 是(2)的可行决策规则。 然而,Bertsimas 等人。
(2019,命题 3)表明不存在满足(2)的线性决策规则。 因此,本例不满足命题 2 的充分条件。
我们接下来提出一个更强的结果(引理 1),它为 [A4] 提供了充分必要条件。 引理的陈述需要以下符号。
定义 1. 对于任何第一阶段决策 x ∈ R n ,实现 ζ̂ ∈ Ξ ,半径 > 0 和资源矩阵集 C ⊆ R r×d
()
量 Q C (x, ζ̂) 被理解为当Π 是线性决策规则的受限空间时的多策略逼近的第二阶段成本,即具有作为 C 元素的追索矩阵的线性决策规则空间 ⊆ R r×d 。 为了发展直觉,我们注意到多策略逼近中的目标函数可以等价地表示为 P N r×d V̂ N MP (x) = c | x + N 1 i=1 Q R N (x, ξ i ) 当Π = L 时。
鉴于上述定义,我们现在提出[A4]的两个充分必要条件。
引理 1. 条件 [A4]、[A5] 和 [A6] 是等价的。
()
证明。
见附录 B。
15 让我们解释引理 1 中发展的条件。关于 [A5],我们记得如果多面体 Ξ ⊆ R d 至少有一个极值点,那么多面体的极值点就是它的最小面(Conforti et al. 2014,第 3 节)。 因此,如果存在一个第一阶段决策 x ∈ R n 满足 Q(x, ζ) < ∞ 对于所有 ζ ∈ Ξ,并且如果多面体 Ξ ⊆ R d 至少有一个极值点,那么 [A5] 可以 通过检查是否存在在 Ξ 的每个极值点周围的球中可行的线性决策规则来验证。 我们通过返回示例 2 来说明验证条件 [A5](最终是 [A4])的过程。
示例 2,继续。 我们记得决策规则 y(ζ) = | ζ 1 - ζ 2 | 满足约束(2),并且在这个问题中没有第一阶段决策。 因此,我们得出结论,条件 [A5(a)] 得到满足。 接下来,我们观察到 Ξ 的极值点由下式给出
()
考虑半径 = 1/ 2 并观察到,对于 Ξ 的每个极值点 ζ̂,集合 B( ζ̂, ) ∩ Ξ 包含在由 ζ̂ 的凸包及其两个相邻极值点形成的单纯形内。
换句话说,对于每个极值点 ζ̂,集合 B( ζ̂, ) ∩ Ξ 包含在定义为的单纯形中我们还观察到极值点是仿射独立的。 因此,从与 Bertsimas 和 Goyal (2012, Theorem 1) 相同的推理得出,对于所有 ζ ∈ P ζ̂ ,存在满足约束 (2) 的线性决策规则。 由于集合 B( ζ̂, ) ∩ Ξ 包含在每个极值点的单纯形 P ζ̂ 中,我们已经证明条件 [A5(b)] 成立。 我们得出结论条件 [A5] 成立,并且由于引理 1 暗示条件 [A5] 和 [A4] 是等价的,我们得出结论条件 [A4] 也成立。
总之,我们提供了两种可能的程序来验证条件 [A4]。 第一个过程,也是迄今为止最简单的过程,是通过解决稳健的优化问题来检查命题 2 中的充分条件。 对于第一个程序不能产生肯定结论的问题,可以通过检查条件 [A5] 进行第二个程序(尽管更复杂)。 使用第二个过程,我们提供了证据(示例 2),即使当两阶段问题没有对多面体 Ξ 中的所有实现都可行的线性决策规则时,条件 [A4] 也可以成立。 该结果被视为阳性,因为它表明 [A4] 可能是一种轻度疾病。 最后,正如上一节末尾所讨论的,我们还没有找到满足 [A2-A3] 和 { x ∈ R n : Q(x, ζ) < ∞ ∀ ζ ∈ Ξ } = ∅的两阶段问题 但不满足条件[A4]。 这些条件是否等效的问题有待未来的研究。
虽然在本节中没有使用,引理 1 中的 [A6] 为 [A4] 提供了另一个充分必要条件。 条件 [A6] 与 [A4] 有类似的解释,除了前者强加了一个可行性要求,该要求必须适用于具有有限数量的追索矩阵的线性决策规则。 [A4] 的这个充分必要条件将在 4.3 节的证明中发挥重要作用。
4.2 中介引理
我们在 4.3 节中对定理 2 的证明是三个中间结果(引理 1、2 和 3)的顶点。 第一个结果,引理 1,在上一节中介绍。
在本节中,我们陈述和证明引理 2 和 3。
为了简化我们的阐述,我们在第 4.2 节中假设条件 [A2-A3] 成立。 令 x ∗ ∈ R n 表示问题 (OPT) 的最佳第一阶段决策,其存在直接来自条件 [A3]。 此外,让对最优第一阶段决策可行的实现集 ζ ∈ Ξ 表示为
()
我们现在介绍本节的第一个结果(引理 2)。 回忆上一节(定义 1)中 Q C (x, ζ̂) 的符号。 引理 2 的目的是表明,对于追索矩阵 C ⊆ R r×d 的集合,存在一个任意接近 x ∗ 的第一阶段决策 x 0 ∈ R n 满足 Q C (x 0 , ζ) < ∞ 对于所有 ζ ∈ Ξ ∗ 。
引理 2. 令 x ∈ R n , C ⊆ R r×d , and ¯ > 0 满足 Q C¯ (x, ζ) < ∞ 对于所有 ζ ∈ Ξ ∗ 。 然后,对于每个 λ ∈ (0, 1) 存在 > 0 使得 Q C (λx ∗ + (1 − λ)x, ζ) < ∞ 对于所有 ζ ∈ Ξ ∗ 。
证明。
固定 λ ∈ (0, 1),并考虑任何实现 ζ̂ ∈ Ξ ∗ 。 在附录 C 中,我们表明存在一个半径 > 0(仅取决于 λ、¯ 、 Ξ 和 Ξ ∗ )和一个实现 ζ̄ ∈ Ξ ∗ 使得
(3-6)
我们现在提出最终的中间引理,引理 3,它提供了多策略逼近的第二阶段成本与随机问题的第二阶段成本之间的差距的上限:
()
证明。
我们首先证明量 Q C (x, ζ̂)、Q(x, ζ̂) 和 Q(x ∗ , ζ̂) 对于所有实现 ζ̂ ∈ Ξ ∗ 都是有限的。 事实上,它直接来自 Ξ ∗ 的定义和 x、C 的构造,并且
()
此外,由于多面体 D ⊆ R m 是非空的,因此从第 (6) 行可以得出
()
由于定义 1 意味着不等式 Q(x, ζ̂) ≤ Q C (x, ζ̂) 适用于所有实现 ζ̂ ∈ Ξ ∗ ,我们已经证明了量 Q C (x, ζ̂), Q(x, ζ̂) , 和 Q(x ∗ , ζ̂) 对于所有实现 ζ̂ ∈ Ξ ∗ 都是有限的。
现在考虑任意实现 ζ̂ ∈ Ξ ∗ 。 由于 Q C (x, ζ̂) 是有限的,我们观察到存在一个资源矩阵 Ỹ ∈ C 使得以下优化问题具有有限的最优成本:
(7)
特别是,我们注意到 (7) 的最优成本是 Q C (x, ζ̂) > -∞ 的上限,并且这种资源矩阵的存在遵循 Q C (x, ζ̂) < ∞ 。
我们的目标是获得 (7) 的上限,我们开发了以下中间结果:
(8)
实际上,第一个等式是稳健优化中的标准重新表述技术。 第二个等式源于线性优化的强对偶性,因为问题有一个有限的目标函数。 第三个等式来自线性规划的基本定理,该定理成立是因为 D 的极值点集合是非空的并且问题具有有限的最优成本。 不等式成立是因为我们已经从内部最大化问题中移除了约束。 最后的等式直接来自对偶范数的定义。
我们现在结合(7)和(8):
(9)
事实上,第一个不等式来自于分离出 (7) 的目标函数并利用 (7) 的最优成本是 Q C (x, ζ̂) 的上限这一事实。 第二个不等式来自对偶范数的定义和第 (8) 行。 第一个等式来自于重新排列项,第二个等式来自于 W | 对于所有 δ ∈ D,δ = q。第三个不等式来自于将单个最大化问题分成两个单独的最大化问题。 第四个不等式来自于资源矩阵的最大化。 最后的等式来自 η C 的定义,第 (6) 行,以及线性规划的基本定理,因为 Q(x, ζ̂) 是有限的,所以它成立。
最后,
(10)
实际上,第一个等式来自第 (6) 行和线性规划的基本定理,因为 Q(x, ζ̂) 和 Q(x ∗ , ζ̂) 是有限的并且至少有一个极值点,所以它成立。 第一个不等式源于对两个最大问题使用相同的最大化器,第二个不等式源于对偶范数的定义,第三个不等式源于 L 的定义。
结合 (9) 和 (10),由于 ζ̂ ∈ Ξ ∗ 是任意选择的,所以我们的证明是完整的
4.3 定理 2的证明
在本节中,我们介绍定理 2 的证明。我们首先从广义的角度讨论证明,重点关注其总体策略并突出其关键步骤,然后利用前几节中的技术中介引理来证明定理。
定理 2 本质上是两个结果的组合。 第 (1) 行中呈现的第一个结果表明,两阶段样本鲁棒优化的最优成本及其多策略逼近几乎肯定会收敛到两阶段随机线性优化的最优成本。 第二个结果为最优第一阶段决策的序列建立了收敛保证。 很方便地,第二个结果将作为第 (1) 行的直接结果,以及 Robinson (1996) 对表收敛函数的近似最优解的收敛保证。
因此,我们的工作集中在第 (1) 行的证明上。
SRO 我们的第 (1) 行证明有两个主要步骤。 第一步是证明 lim inf N →∞ v̂ N MP 和 lim inf N →∞ v̂ N 几乎肯定是 v ∗ 的上界。 幸运的是,这一步很容易通过 SAA 显示,因为这两个量都是 lim inf N →∞ v̂ N 的上限,并且直接从 King and Wets (1991) 和 Robinson (1996) 的结果得出样本平均的最优成本 在条件 [A2-A3] 下,近似值几乎肯定会收敛到 v *(详见下文)。
SRO MP 我们证明第 (1) 行的第二步是证明 lim sup N →∞ v̂ N 和 lim sup N →∞ v̂ N 几乎肯定是 v ∗ 的下界; 这通过结合第 4.1 节和第 4.2 节中的引理 1、2 和 3 来证明。
和 4.2。
鉴于上述讨论,我们现在给出定理 2 的证明。
定理 2 的证明。
SRO MP 我们首先证明 lim inf N →∞ v̂ N 和 lim inf N →∞ v̂ N 几乎肯定是 v ∗ 的上界。 实际上,它直接从条件 [A2-A3]、King 和 Wets SAA(1991,定理 3.1)和 Robinson(1996,推论 3.11)得出 lim N →∞ v̂ N = v ∗ 几乎肯定。
SRO SAA 此外,我们很容易观察到不等式 v̂ N ≥ v̂ N 始终成立,并且定理 1 进一步 MP SRO 建立了不等式 v̂ N ≥ v̂ N 。 所以,
()
我们接下来证明另一个方向,即 lim sup N →∞ v̂ N 和 lim sup N →∞ v̂ N 几乎肯定是 v ∗ 的下界。 事实上,引理 1 表明 [A4] 蕴含 [A6]。 根据条件 [A6] 的定义,存在第一阶段决策 x̄ ∈ R n ,半径 ¯ > 0,以及有限的追索矩阵 C ⊆ R r×d 集,使得
()
选择任意任意 λ ∈ (0, 1) 然后引理 2 意味着存在一个半径 > 0 使得
()
为了符号方便,设 x , λx̄ + (1 − λ)x ∗ 。 此外,条件 [A1] 意味着存在整数 N̄ ∈ N 使得 N ≤ 对于所有 N ≥ N̄ 。 所以,
()
事实上,第一行来自定理 1,以及第一阶段决策 x 对于多策略逼近可能不是最优的这一事实。 第二行来自 Π = L ,由条件 [A1] 给出。 第三行成立,因为资源矩阵 C 的集合是 R r×d 的子集。 第四行来自引理 3,同时观察到 Q C N (x, ζ) ≤ Q C (x, ζ) < ∞ 对于所有 N ≥ N̄ 和 ζ ∈ Ξ ∗ ,并且几乎肯定成立,因为 P(ξ i ∈ Ξ ∗ 对于所有 i) = 1。第五行从 N → 0 开始,为 N → ∞ ,由条件 [A1] 给出。
第六行来自 x 的定义。 最后一行遵循大数的强定律和 x ∗ 对于问题 (OPT) 是最优的事实。 取 λ ∈ (0, 1) 任意接近 0,我们得出结论:
()
结合以上结果,我们对第(1)行的证明就完成了。
我们现在建立最优第一阶段决策的收敛性。 令 { x̂ MP N } N ∈N 是问题 (MP) 的最佳第一阶段决策序列。 然后从第 (1) 行得出
()
以上暗示,几乎可以肯定,有一个非负数序列 { η N } 将 SAA 收敛到零,它们满足 V̂ N SAA (x̂ MP + η N 对于所有 N ∈ N。因此,它直接从 N ) ≤ v̂ N 个条件 [A2-A3] 和 King and Wets (1991, Proposition 2.1 and Theorem 3.1) 认为序列 { x̂ MP N } N ∈N 的任何累积点几乎肯定是问题 (OPT) 的最佳第一阶段决策。 问题(SRO)的最佳第一阶段决策的类似收敛结果遵循相同的推理,因此被省略。
5 计算实验
在本节中,我们展示了使用多策略逼近解决两阶段样本鲁棒优化的实际价值。 更具体地说,我们分析了以下各种数据驱动方法的计算易处理性和样本外性能: 1. MP Affine - 使用线性决策规则的两阶段样本鲁棒优化的多策略近似,其中不确定性设置在 SRO 公式使用2 范数。
2. SP 仿射 - 使用线性决策规则的两阶段样本鲁棒优化的单策略近似,其中 SRO 公式中的不确定性集使用 2 范数。
3. Wass SDP - Hanasusanto 和 Kuhn (2018) 的半定 (SDP) 圆锥逼近,用于使用 `2 范数设置的类型 2 Wasserstein 模糊度的两阶段分布稳健优化。
4. Wass SW - Chen 等人的事件改编。 (2020)使用与 Wass SDP 相同的歧义集进行两阶段分布鲁棒优化。
5. 近似 PCM - Bertsimas 等人的提升线性决策规则方法。 (2019)用于两阶段分布鲁棒优化,其中歧义集由第一和第二矩(从训练数据估计)定义。
6. SAA - 样本平均近似值。
为了比较这些方法,我们首先生成一个大小为 Ñ = 10 4 的测试数据集。 然后,对于不同的 N 值,我们生成 M = 100 个大小为 N 的训练数据集。 对于每个训练集 j ∈ [M ] 和每个方法 A ,我们计算最优的第一阶段决策 x A,j N 和相应的目标 A,j 值 v̂ N 。 使用第一阶段决策的预期成本估计为
()
我们根据以下指标比较每种方法
1.Tratability - 该方法的运行时间,在 M 个训练集上取平均值。
2.可行性——第一阶段决策可行的测试集中实现的比例:
()
3. 最优性差距 - 使用 x A,j 的预期成本与最优 N 预期成本之间的相对差距:
()
其中 v ∗ 通过求解大小为 10 5 的独立数据集的 SAA 来估计。
4. 预测误差——方法的最优成本与其最优第一阶段决策的预期成本之间的相对差异:
()
5.1 有容量的网络库存管理问题
5.1.1 问题描述 我们考虑一个两阶段容量的网络库存问题。 有 n 个位置,每个位置 i 都有一个未知需求 ξ i 必须满足。
需求可以通过在该地点预先购买的现有库存 x i 来满足,或者通过从地点 j 运输数量为 y ji 的单位来满足,这是在实现需求后确定的。 在位置 i 提前购买库存的成本是 a i 每单位,而将每个单位从位置 i 运输到 j 的成本是 c ij 。 每个地点的库存量是有限的 K 单位,从 i 到 j 最多只能运输 b ij 单位。 我们的目标是找到最小化预期总成本的最优初始库存
(11)
第二阶段成本是
()
我们假设潜在的概率分布是未知的。 相反,我们唯一的信息来自历史数据 ξ 1 , 。 . . , ξ N , 以及支持包含在
(12)
5.1.2. 实验 我们生成一个大小为 n = 10 的网络,其中每个位置都来自标准的二维高斯分布。 对于每个位置 i 6 = j,我们让 c ij 是位置之间的欧几里得距离,a i = 1,K = 20,并且 b ij = K/(n - 1)u ij 其中 u ij 是 i.i.d。 从标准均匀分布生成的随机变量。
我们考虑问题 (SRO) 的稳健性参数,其比率为 N = 10N -1/10 和 N = 20N -1/10。 这些鲁棒性参数的选择受到概率性能保证的启发,该保证可以通过用于条件良好的有界分布的类型∞ Wasserstein 模糊集获得,如附录 D 中所述。粗略地说,这些鲁棒性参数的比率提供了以下保证: ,如果底层分布恰好满足某些条件并且数据点的数量 N 足够大,那么任何可行的 SRO、MP Affine 或 SP Affine 的第一阶段决策对于随机问题都是可行的。 在实践中,例如可以通过对历史数据执行 k 折交叉验证来确定稳健性参数。
相比之下,Approx PCM、Wass SDP 和 Wass SW 保证产生对随机问题可行的第一阶段决策。 然而,这些方法将他们的搜索限制在第一阶段决策,这些决策对所有实现 ζ ∈ Ξ 都有一个可行的第二阶段决策。
因此,这些方法将只产生一个可行的第一阶段决策,即 x = (K, . . ., K)。
对于这个第一阶段决策,最优的第二阶段决策规则由 y(ζ) = 0 给出,对于所有 ζ ∈ Ξ。 因此,无论历史数据的值如何,Approx PCM、Wass P n SDP 和 Wass SW 的最优成本将等于 K i=1 a i 。
最后,我们考虑 √ 需求分量(均值 K/2 和标准差 K/12)的三种概率分布(均匀、正态和对数正态),并使用拒绝抽样,使得每个多元分布的(未知)支持为
(13)
5.1.3. 结果
可追踪性。 MP 和 SP 方法的运行时间大致相同,对于所有数据集大小 N,每个数据点的运行时间在 0.4 到 1.5 秒之间。 每个数据点的 SAA 运行时间介于 1 到 2 毫秒之间。 由于其余方法具有 x = (K, . . . , K) 的平凡封闭形式解,因此省略了它们的运行时间。
可行性。 图 2 比较了不同方法的样本外可行性。 这些结果表明,在鲁棒性参数 N 的所有分布和选择中,多策略逼近的可行性性能明显优于 SAA。 与附录 D 中的理论性能保证一致,结果显示
figure 2
SRO 的多策略近似可以有效地解决没有相对完整的追索权的问题。 此外,结果表明,即使对于中等大小的数据集,多策略近似生成的解决方案也具有很高的可能性,而不会像其他分布稳健的方法那样将解决方案限制为对于 Ξ 中的每个实现都可行的解决方案。
最优性。 图 3 显示了各种方法的最优性差距。
多策略逼近的结果与第 4 节的渐近最优性保证一致,表明 MP Affine 的最优性差距随着获得的数据越多而减小,并且当所有分布的 N = 512 时差距几乎为零。 相比之下,SP Affine 的最优性差距并没有随着获得更多数据而改善,而是随着更准确地估计支持度而增加,并且需要在更大的集合上具有可行性。 此外,需要在整个 Ξ 上具有可行性的分布式鲁棒方法总是会产生平均性能较差的第一阶段决策。
预言。 图 4 显示了各种方法的预测差距。 我们看到 MP Affine 和 SP Affine 为其规定的第一阶段决策的平均成本提供了有意义的上限。 相比之下,SAA 既低估又高估了真实性能,这取决于分布类型和训练数据集中的点数。 由于要求所有 Ξ 的可行性导致恒定的第一阶段决策和第二阶段决策等于零,因此分布鲁棒的方法可以轻松实现准确的预测。
figure 3
figure 4
5.2 医疗调度问题
在本节中,我们进行了一个实验,该实验提供了数值证据,证明我们的方法的性能可以与使用 1 型 Wasserstein 模糊集进行分布式鲁棒优化的最新方法相匹配。
5.2.1 问题描述 我们考虑以下基于 Bertsimas 等人的医疗调度问题。 (2019 年),其中诊所的任务是安排医生对 n 名患者的日常预约。 患者按升序到达,即患者 1 排在患者 2 之前,以此类推。 医生从时间 0 到 T 工作,之后有加班费。 目标是安排约会,以使总等待时间和加班成本最小化。
第一阶段决策 x ∈ R n + 是时间表,其中 x i 是分配给患者 i 的预约长度 P i 。 因此,安排患者 i + 1 的预约在时间 j=1 x j 开始。 所有的预约都必须安排在医生的常规时间内,由约束条件 P n i=1 x i ≤ T 表示。 第 i 个患者的实际预约时间为 ξ i ≥ 0。第二阶段决策 y ∈ R n+1 对应于等待时间; 对于每个 i ∈ [n],y i 是患者 i 的等待时间,+ 和 y n+1 是医生要求的加班时间。 第一个患者将在时间 0 到达时入院,这通过设置 y 1 = 0 来强制执行。给定预约长度的实现 ξ,通过以下递归公式找到等待时间:
()
医生每单位加班花费诊所 c,每位患者每单位等待时间花费诊所 1。 我们的目标是找到最小化预期成本的时间表:
()
table 1
5.2.2. 实验 我们考虑一个例子,n = 8 名患者,成本参数 c = 2。
对于每个患者,我们在 [30, 60] 上均匀地生成平均值 μ i 并在 [0, 0.3 μ i ] 上均匀地生成标准偏差 σ i 。 我们考虑三个概率分布(均匀、正态、对数正态)以及相应的均值和标准差,并且我们使用拒绝抽样来获得 P n 个非负实现。 医生的固定时间设置为 T = i=1 µ i + 0.5 k σ k 2 。 由于不知道有关约会长度的其他信息,我们为所有方法设置 Ξ = R n +。 对于 SP Affine、MP Affine、Wass SDP 和 Wass SW,我们使用稳健性参数 N = N -1/8。
5.2.3 结果
可追踪性。 每种方法的运行时间如表 1 所示。我们观察到,对于所有 N 值,多策略近似在计算上仍然易于处理。 Approx PCM 方法的运行时间不依赖于训练数据集的大小 N,因为这种方法适用于聚合数据,并且其他方法的运行时间通常在 N 中线性扩展。
可行性。 由于该问题具有相对完全的追索权,因此第二阶段问题对于任何非负的第一阶段决策总是可行的。
最优性。 图 5 显示了各种方法的最优差距。 我们观察到 MP Affine、Wass SW 和 SAA 的最优性差距几乎相同,并且随着 N 的增大而收敛到零。
预言 图 6 显示了每种方法的平均预测误差。 SAA 对 50% 到 80% 的训练数据集产生了负预测误差,具体取决于 N 的值。 相比之下,MP Affine 和 Wass SW 方法产生几乎相同的预测误差,始终在 5% - 10% 之间,因此产生了真实样本外性能的可靠上限。
figure 5
figure 6
6 结论和展望
在本文中,我们研究了一种基于重叠决策规则的近似方案,用于解决具有类型∞ Wasserstein 模糊集的数据驱动的两阶段分布鲁棒优化问题。 多策略逼近简单、易处理且可证明在温和假设下渐近最优。 一个自然的问题是,是否可以利用多策略方法或其变体来获得其他稳健公式的接近最优近似值。 我们注意到,我们在样本鲁棒优化中证明多策略方法的渐近最优性的一个基本方面是,随着获得更多数据点,每个不确定性集的大小都会缩小。 因此,每个线性决策规则所在的局部区域随着时间的推移优化变得更小。 出于这个原因,将我们的渐近最优性保证扩展到其他分布稳健的优化设置也可能依赖于这个属性。