学习了解大模型的四大缺陷

由中国人工智能学会主办的第十三届吴文俊人工智能科学技术奖颁奖典礼暨2023中国人工智能产业年会于2024年4月14日闭幕。

会上,中国工程院院士、同济大学校长郑庆华认为,大模型已经成为当前人工智能的巅峰,大模型之所以强,是依托了大数据、大算力和强算法,但是也面临着若干缺陷。

郑庆华总结了大模型存在的四大固有缺陷。

缺陷一,是过度消耗数据和算力。大模型的参数量已达到万亿级别,训练数据规模和算力消耗与参数规模成正比。

缺陷二,是灾难性遗忘。在新任务上训练会损害之前任务的性能;在问题求解阶段,无法记住处理过的数据或场景,比如在无人驾驶中,人脑对路况有记忆,但自动驾驶每次都要重新计算,并为此消耗了大量能量。

缺陷三,是黑盒模型逻辑推理能力弱,大模型缺乏“分而治之”能力,在处理需要逻辑、数值推理等复杂问题时表现不佳,无法举一反三、触类旁通。

缺陷四,是大模型不知道自己错了,也不知道为啥错,更做不到知错就改。以GPT4求解算术运算题的实例为例,对于在1381和1453之间选两个随机数相乘的结果给出了错误答案,被指出错误后,无法定位是语料,还是训练等原因,更无从修正。

对于第四条,个人特地选择了几种流行的人工智能平台进行了测试,包括gpt4,kimi,文心一言3.5,讯飞星火。测试结果如图所示,结果全军覆没,讯飞规避回答🤣……

b0851079c7314f72b9cb8144e4efb6c2.jpg

273deeebd7e54a858c38e32676d54751.jpg 

5eea75da7fd54dcdbd53583a84c28eaa.jpg 

088cdd4c957947d29ae2391aa9ec3b49.jpg 

 

 

相关推荐

  1. 轻松了解深度学习模型

    2024-04-23 00:30:02       33 阅读
  2. 模型学习

    2024-04-23 00:30:02       54 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-23 00:30:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-23 00:30:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-23 00:30:02       87 阅读
  4. Python语言-面向对象

    2024-04-23 00:30:02       96 阅读

热门阅读

  1. Qt Creator 调试控制台无法查看 log4z 的日志

    2024-04-23 00:30:02       30 阅读
  2. 解决Valid在@RequestParam场景不生效的问题

    2024-04-23 00:30:02       39 阅读
  3. C语言例题(递归、二分查找、冒泡排序)

    2024-04-23 00:30:02       36 阅读
  4. 在nginx配置中返回文本

    2024-04-23 00:30:02       36 阅读
  5. 年轻人选择程序员岗位往往都有哪些原因

    2024-04-23 00:30:02       27 阅读
  6. 若依框架升级SpringBoot3

    2024-04-23 00:30:02       38 阅读
  7. 设计模式|组合模式(Composite Pattern)

    2024-04-23 00:30:02       37 阅读
  8. mybatis使用xml中的if-else/choose

    2024-04-23 00:30:02       34 阅读
  9. c#程序调用c++开发dll库

    2024-04-23 00:30:02       30 阅读
  10. C# AutoResetEvent

    2024-04-23 00:30:02       30 阅读
  11. MongoDB【五】索引

    2024-04-23 00:30:02       35 阅读
  12. 牛客网华为机试题说明一

    2024-04-23 00:30:02       32 阅读
  13. k8s的服务Service暴露应用

    2024-04-23 00:30:02       31 阅读