2024年,搞AI就别卷模型了

你好,我是三桥君

2022年11月30日,OpenAI发布了一款全新的对话式通用人工智能工具——ChatGPT

该工具发布后,仅用5天时间就吸引了100万活跃用户,而在短短2个月内,其活跃用户数更是飙升至1亿,成为历史上增长速度最快的消费者应用程序!

什么概念?

就连国际版抖音TikTok达到1亿用户都用了9个月,而Instagram则花了两年半的时间。

想要深入了解AI,可以看我写的这篇文章:

《为什么要了解AI?突破》

Al曾经因为商业化的难题而受到外界的批评,但是随着OpenAl的ChatGPT的推出,它成为了搅动AI大模型领域的催化剂。突然之间,各种竞争者纷纷加入这场竞赛。

可以说就在一夜之间,AI大模型热得发烫。

百度率先加入战局,凭借“文心一言”抢占了与ChatGPT对标的“国内第一”位置,自此之后,大模型成为了市场的关注焦点。

特别是在那之后,各个领域的竞争者都开始全力以赴,迅速行动起来,密集地投入到这场竞争中,全力以赴地推动大模型的发展!可以说真的“卷”!

总之,大模型领域,彻底火起来了。

百度率先发起挑战,紧随其后的是阿里和商汤,它们都迅速跟进,并且是最为积极和迅速的,都已经推出了类似ChatGPT的产品。

以下是从2023年以来的一些大模型创业公司及产品:

  1. 复旦大学正式发布“MOSS”大模型

  2. 澜舟科技正式发布“MChat”

  3. 清华大学开启内测中英双语对话模型“ChatGLM-6B”

  4. 百度正式发布“文心一言”

  5. 商汤科技正式发布“日日新”

  6. 阿里巴巴正式发布“通义千问”

  7. 昆仑万维等正式发布“天工3.5”

  8. 科大讯飞发布了 “星火认知大模型”

  9. 美图正式发布视觉大模型“MiracleVision(奇想智能)”

  10. 华为正式发布“盘古大模型3.0”

  11. 字节跳动开始公测大语言模型“云雀大模型”

  12. 腾讯正式发布自研通用大语言模型 “混元”

......

可以说,在大模型领域,国内已经经历“百模大战”的时代了。

感兴趣的话,具体可以看我写的这篇文章:

《为什么要了解AI?风口》

三桥君认为,搞AI还是别卷大模型了。

为什么我会这么说呢?

因为群雄逐鹿,最后会是一将功成万骨枯。 胜利者,只是活下来的罢了。

这种战况局面让我联想到以前的“千团大战”。

在2010年至2015年期间,中国互联网领域经历了一场声势浩大的“千团大战”。这场竞争中,团购网站的数量从顶峰时期的5600家急剧减少至仅剩两家。在这五年的激烈角逐中,可以说美团才是最后的赢家。

训练大模型,成本非常高昂,动不动就上亿元起步,而且很耗能源。

训练大模型成本有多高呢?

2017年,训练一个基础的Transformer模型大约需要900美元。然而,到了2019年,训练一个RoBERTa Large模型的成本已经上升到了大约160000美元。进一步到了2023年,OpenAI的GPT-4模型和Google的Gemini Ultra模型的训练成本更是分别高达约7800万美元和近2亿美元!

不跟你开玩笑,训练大模型的成本是越来越贵~

训练大模型耗电有多高呢?

以GPT-3的训练为例,训练过程使用了大约128.7万度的电力。

该如何理解这个耗电量?

这相当于约6400户中国普通家庭一个月的电能消耗。有专家做过一个形象的比喻,这大致等同于3000辆特斯拉电动汽车同时行驶,每辆车行驶20万英里。

因此,三桥君认为,2024年,如果要搞AI还是别卷大模型了。除非你有这个资本去打持久战,否则大概率最后一地鸡毛。

也许我与大佬们在这件事上达成了共识。

2024年7月,知名大型AI峰会召开。其中,某大厂创始人站出来呼吁各位,“大家不要卷模型,要卷应用!

因为训练大模型真的耗钱耗能源,卷模型只会加剧。

那为什么劝大家卷应用呢?

因为将这些技术应用于实际场景,解决实际问题。就算没活下来,我认为至少给咱老百姓做贡献了,当福利了嘻嘻~

所以,AI的应用层应该会迎来一波小浪潮。如果你对AI应用感兴趣,可以学学这个内容。

《零基础开发AI聊天机器人》

欢迎订阅课程专栏:

《零基础开发AI聊天机器人》
 

相关推荐

  1. 懂RestTemplate一篇

    2024-07-12 23:54:04       51 阅读
  2. 2024AI模型有哪些新看点?

    2024-07-12 23:54:04       64 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-12 23:54:04       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-12 23:54:04       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-12 23:54:04       45 阅读
  4. Python语言-面向对象

    2024-07-12 23:54:04       55 阅读

热门阅读

  1. 跟我从零开始学STL(STL代码基础02)---vector容器

    2024-07-12 23:54:04       17 阅读
  2. 数据结构第18节 散列表 - 应用

    2024-07-12 23:54:04       19 阅读
  3. C# Modbus

    2024-07-12 23:54:04       19 阅读
  4. 安卓热门面试题一

    2024-07-12 23:54:04       17 阅读
  5. React组件间通信的几种方式

    2024-07-12 23:54:04       16 阅读
  6. TCP/IP模型和OSI模型的区别(面试题)

    2024-07-12 23:54:04       18 阅读
  7. opencv--把cv::Mat数据转为二进制数据的保存和读取

    2024-07-12 23:54:04       18 阅读
  8. 扫地机器人如何进行MTBF测试

    2024-07-12 23:54:04       16 阅读
  9. ffmpeg和imagemagick制作gif动图

    2024-07-12 23:54:04       20 阅读