动态规划法学习

当然,让我们用更生活化的语言和一个实际的例子来解释动态规划,以及如何在实践中应用它。

动态规划通俗理解

想象一下,你是个水果摊老板,每天要决定订购多少苹果,目标是最大化利润。但苹果的价格每天波动,顾客的需求也变化,你该怎么办?

传统做法:每天早上,你都根据昨天的经验和今天的感觉猜测需求,然后订购苹果。但如果猜错,要么苹果卖不完亏本,要么不够卖错过赚钱机会。

动态规划做法:你开始记录每一天的销售数据,包括苹果价格、天气、节假日等因素。第二天,你不再凭感觉,而是根据历史数据预测需求,再决定订购量。因为你“记得”过去的经验,所以可以做出更精准的决策,减少浪费,增加利润。

实践过程详解

以经典的背包问题为例,假设你是个旅行者,背包容量有限,你要从一堆物品中选择装入背包,每件物品有重量和价值,你的目标是让背包里物品的总价值最大,但不超过背包容量。

步骤1:定义问题
  • 状态:背包当前的剩余容量,已经选了哪些物品。
  • 目标:背包内物品价值最大化。
步骤2:构建状态转移方程
  • 假设 d p [ i ] [ j ] dp[i][j] dp[i][j]表示前i件物品装入容量为j的背包中的最大价值。
  • 状态转移方程为: d p [ i ] [ j ] = m a x ( d p [ i − 1 ] [ j ] , d p [ i − 1 ] [ j − w e i g h t [ i ] ] + v a l u e [ i ] ) dp[i][j] = max(dp[i-1][j], dp[i-1][j-weight[i]] + value[i]) dp[i][j]=max(dp[i1][j],dp[i1][jweight[i]]+value[i]),其中 w e i g h t [ i ] weight[i] weight[i] v a l u e [ i ] value[i] value[i]分别是第i件物品的重量和价值。
状态定义

我们定义 d p [ i ] [ j ] dp[i][j] dp[i][j]表示考虑前 i i i个物品,且背包容量为 j j j时,所能达到的最大价值。

状态转移方程

状态转移方程是这样的:

d p [ i ] [ j ] = max ⁡ ( d p [ i − 1 ] [ j ] , d p [ i − 1 ] [ j − w i ] + v i ) dp[i][j] = \max(dp[i-1][j], dp[i-1][j-w_i] + v_i) dp[i][j]=max(dp[i1][j],dp[i1][jwi]+vi)

这里:

  • d p [ i − 1 ] [ j ] dp[i-1][j] dp[i1][j] 表示不拿第 i i i个物品,此时最大价值就是前 i − 1 i-1 i1个物品在容量为 j j j的背包下的最大价值。
  • d p [ i − 1 ] [ j − w i ] + v i dp[i-1][j-w_i] + v_i dp[i1][jwi]+vi表示拿了第 i i i个物品,此时背包剩余容量为 j − w i j-w_i jwi w i w_i wi是第$ 个物品的重量),然后加上第 个物品的重量),然后加上第 个物品的重量),然后加上第i$个物品的价值 v i v_i vi
方程解读

这个方程意味着我们在考虑第 i i i个物品时,有两种选择:

  1. 不拿第 i i i个物品:此时最大价值取决于前 i − 1 i-1 i1个物品在容量为 j j j的背包下能达到的最大价值,即 d p [ i − 1 ] [ j ] dp[i-1][j] dp[i1][j]
  2. 拿第 i i i个物品:此时我们需要确保背包容量足够装下这个物品,即 j > = w i j >= w_i j>=wi。在这种情况下,我们的最大价值由前 i − 1 i-1 i1个物品在剩余容量 j − w i j-w_i jwi下的最大价值加上第 i i i个物品的价值组成,即 d p [ i − 1 ] [ j − w i ] + v i dp[i-1][j-w_i] + v_i dp[i1][jwi]+vi

最终,我们取这两种选择中价值更大的那个作为 d p [ i ] [ j ] dp[i][j] dp[i][j]的值。

步骤3:初始化边界条件
  • 当背包容量为0或没有物品时,价值为0,即 d p [ 0 ] [ j ] = 0 dp[0][j] = 0 dp[0][j]=0 d p [ i ] [ 0 ] = 0 dp[i][0] = 0 dp[i][0]=0
步骤4:计算
  • d p [ 0 ] [ 0 ] dp[0][0] dp[0][0]开始,按行或列递增地填充整个二维数组,直到得到 d p [ n ] [ W ] dp[n][W] dp[n][W],即为所求的最大价值。
实践注意点
  1. 状态定义要准确:状态必须包含足够的信息来描述问题,但又不能过于复杂,否则计算量会很大。
  2. 避免重复计算:动态规划的核心是记忆化,即保存已计算的状态,避免重复计算相同的子问题。
  3. 边界条件:正确的边界条件是关键,否则可能导致整个解法失效。
  4. 空间优化:有时可以通过观察状态转移方程,仅保留必要的状态信息,减少内存消耗。

结语

动态规划就像一个智慧的决策者,它通过分析过去的“经验”(子问题的解),来做出更好的“未来决策”(解决大问题)。在实践中,清晰的状态定义、有效的状态转移方程和合理的边界条件是成功应用动态规划的关键。希望这次解释能帮助你更好地理解和掌握动态规划!

相关推荐

  1. 动态规划学习

    2024-06-14 00:00:06       5 阅读
  2. 动态规划

    2024-06-14 00:00:06       7 阅读
  3. 动态规划学习

    2024-06-14 00:00:06       8 阅读
  4. 动态规划学习——机器人运动

    2024-06-14 00:00:06       34 阅读
  5. 动态规划学习——背包问题

    2024-06-14 00:00:06       30 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-14 00:00:06       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-14 00:00:06       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-14 00:00:06       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-14 00:00:06       20 阅读

热门阅读

  1. python 循环导入(circular imports)解决方法

    2024-06-14 00:00:06       11 阅读
  2. spring

    spring

    2024-06-14 00:00:06      9 阅读
  3. ZC2205-24V500mAUltralow-Quiescent-Current LDO

    2024-06-14 00:00:06       7 阅读
  4. 613作业

    613作业

    2024-06-14 00:00:06      10 阅读
  5. 开源AI大模型项目推荐

    2024-06-14 00:00:06       9 阅读
  6. 如何理解分类任务中的logits?

    2024-06-14 00:00:06       4 阅读
  7. 浅谈学习数据结构-------顺序表的感受

    2024-06-14 00:00:06       6 阅读
  8. 为什么要选择AWS?AWS的优势有哪些?

    2024-06-14 00:00:06       6 阅读
  9. 【C++学习笔记 1】C++程序是怎样运行的

    2024-06-14 00:00:06       4 阅读
  10. 【无标题】计算机网络 4.2同轴电缆

    2024-06-14 00:00:06       6 阅读