智能交通(4)——问题分析

输入

综合信息(车辆信息和道路信息)

高维矩阵(实际上大部分都不采用高维矩阵而是状态向量,此处仅帮助理解)

车辆数量                 [5,13,7,12]      物理含义:分别代表东南西北四个方向的车辆数量

信号灯状态             [0,1,0,1]          物理含义:表示北和南方向是红灯,东和西方向是绿灯

排队长度                [13,0,12,0]      物理含义:分别表示因为信号灯而阻塞的车辆

车辆等待时间         [60,0,60,0]      物理含义:分别代表东南西北四个方向的车辆平均等待时间

车辆速度                [0,10,0,10]      物理含义:分别代表东南西北四个方向的车辆平均速度

状态向量

  • 东方向的状态向量:[5,0,13,60,0]
  • 南方向的状态向量:[13,1,0,0,10]
  • 西方向的状态向量:[7,0,12,60,0]
  • 北方向的状态向量:[12,1,0,0,10]

为什么不直接使用高维矩阵,而要采用状态向量?

将动作和奖励整合到状态向量中,以形成一个完整的强化学习输入。

完整的强化学习输入示例:

假设当前的动作是将东和西方向切换到红灯,其他方向切换到绿灯,我们的动作向量可以是:

  • 动作向量:[1,0,1,0]

假设执行上述动作后,新的车辆等待时间变为北和南方向0秒(因为车辆可以立即通过),东和西的等待时间开始增加。我们将计算新的奖励。

将这些信息整合到状态向量中,我们得到:

输出

FRAP模型的输出是一个向量,其中每个数值代表一个可能动作的Q值,模型通过选择具有最高Q值的动作来进行决策。

优化目标

1.最小平均车辆排队长度

2.最小平均车辆延误

3.最大平均车速

约束条件

  1. 交通规则:信号控制必须遵守交通规则,例如,不允许相向直行的车辆同时获得绿灯。

  2. 信号灯阶段的互斥性:某些信号灯阶段是互斥的,不能同时激活,以避免交通冲突。

  3. 泛化能力:模型需要能够适应不同的交通条件和交叉口结构,具有跨场景的泛化能力。

  4. 计算效率:模型的决策过程需要在有限的时间内完成,以适应实时信号控制的需求。

相关推荐

  1. 在物联网的应用——智能交通

    2024-07-14 23:56:05       24 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 23:56:05       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 23:56:05       71 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 23:56:05       58 阅读
  4. Python语言-面向对象

    2024-07-14 23:56:05       69 阅读

热门阅读

  1. 分析 Android 应用中的日志信息应遵循的原则

    2024-07-14 23:56:05       20 阅读
  2. 牛客周赛51 F(静态区间最大连续子段和)

    2024-07-14 23:56:05       21 阅读
  3. 解锁Postman的API参数化:动态请求的秘诀

    2024-07-14 23:56:05       21 阅读
  4. 如何理解electron 的预加载脚本

    2024-07-14 23:56:05       20 阅读
  5. 力扣题解(回文子串)

    2024-07-14 23:56:05       21 阅读
  6. 题解:P9999 [Ynoi2000] tmostnrq

    2024-07-14 23:56:05       20 阅读