动态规划法学习

2024-06-14 00:00:06
开发
4

当然，让我们用更生活化的语言和一个实际的例子来解释动态规划，以及如何在实践中应用它。

动态规划通俗理解

想象一下，你是个水果摊老板，每天要决定订购多少苹果，目标是最大化利润。但苹果的价格每天波动，顾客的需求也变化，你该怎么办？

传统做法：每天早上，你都根据昨天的经验和今天的感觉猜测需求，然后订购苹果。但如果猜错，要么苹果卖不完亏本，要么不够卖错过赚钱机会。

动态规划做法：你开始记录每一天的销售数据，包括苹果价格、天气、节假日等因素。第二天，你不再凭感觉，而是根据历史数据预测需求，再决定订购量。因为你“记得”过去的经验，所以可以做出更精准的决策，减少浪费，增加利润。

实践过程详解

以经典的背包问题为例，假设你是个旅行者，背包容量有限，你要从一堆物品中选择装入背包，每件物品有重量和价值，你的目标是让背包里物品的总价值最大，但不超过背包容量。

步骤1：定义问题

状态：背包当前的剩余容量，已经选了哪些物品。
目标：背包内物品价值最大化。

步骤2：构建状态转移方程

假设 $d p [i] [j]$ 表示前i件物品装入容量为j的背包中的最大价值。
状态转移方程为： $d p [i] [j] = ma x (d p [i - 1] [j], d p [i - 1] [j - w e i g h t [i]] + v a l u e [i])$ ，其中 $w e i g h t [i]$ 和 $v a l u e [i]$ 分别是第i件物品的重量和价值。

状态定义

我们定义 $d p [i] [j]$ 表示考虑前 $i$ 个物品，且背包容量为 $j$ 时，所能达到的最大价值。

状态转移方程

状态转移方程是这样的：

$dp[i][j] = \max(dp[i-1][j], dp[i-1][j-w_i] + v_i)$

这里：

$d p [i - 1] [j]$ 表示不拿第 $i$ 个物品，此时最大价值就是前 $i - 1$ 个物品在容量为 $j$ 的背包下的最大价值。
$dp[i-1][j-w_i] + v_i$ 表示拿了第 $i$ 个物品，此时背包剩余容量为 $j-w_i$ （ $w_i$ 是第$ $个物品的重量），然后加上第$ i$个物品的价值 $v_i$ 。

方程解读

这个方程意味着我们在考虑第 $i$ 个物品时，有两种选择：

不拿第 $i$ 个物品：此时最大价值取决于前 $i - 1$ 个物品在容量为 $j$ 的背包下能达到的最大价值，即 $d p [i - 1] [j]$ 。
拿第 $i$ 个物品：此时我们需要确保背包容量足够装下这个物品，即 $j >= w_i$ 。在这种情况下，我们的最大价值由前 $i - 1$ 个物品在剩余容量 $j-w_i$ 下的最大价值加上第 $i$ 个物品的价值组成，即 $dp[i-1][j-w_i] + v_i$ 。

最终，我们取这两种选择中价值更大的那个作为 $d p [i] [j]$ 的值。

步骤3：初始化边界条件

当背包容量为0或没有物品时，价值为0，即 $d p [0] [j] = 0$ 和 $d p [i] [0] = 0$ 。

步骤4：计算

从 $d p [0] [0]$ 开始，按行或列递增地填充整个二维数组，直到得到 $d p [n] [W]$ ，即为所求的最大价值。

实践注意点

状态定义要准确：状态必须包含足够的信息来描述问题，但又不能过于复杂，否则计算量会很大。
避免重复计算：动态规划的核心是记忆化，即保存已计算的状态，避免重复计算相同的子问题。
边界条件：正确的边界条件是关键，否则可能导致整个解法失效。
空间优化：有时可以通过观察状态转移方程，仅保留必要的状态信息，减少内存消耗。

结语

动态规划就像一个智慧的决策者，它通过分析过去的“经验”（子问题的解），来做出更好的“未来决策”（解决大问题）。在实践中，清晰的状态定义、有效的状态转移方程和合理的边界条件是成功应用动态规划的关键。希望这次解释能帮助你更好地理解和掌握动态规划！

原文地址:https://blog.csdn.net/pumpkin84514/article/details/139666284 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1801283411856461824.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部