干重活儿的互联网

接女儿放学路过欧尚超市,我说 “十年前我每周末推着小车带你去超市,那时没有这么多送外卖的,什么东西都要自己跑过去买”,“你的意思是要表达科技获得很大进步了吗?” 女儿反问,“不,恰恰相反,我并不觉得这个进步有什么了不起…”

十年前十个人跑,现在十个人刷手机 app,一个人跑,总之还是要人跑不是吗。我对女儿说 “我上大学那会儿,寝室楼下有个卖盖浇饭的,我们在七楼,每次我们都顺个绳子拴个小框下去,把只多不少的钱放进筐里,放入一张纸条写着要什么饭以及分别多少份,店家把饭和找零放进去,我们再拉上七楼…”,“可是如果卖饭的不在楼下,而在比较远的地方呢,不还是要人帮忙送吗?” 女儿问道。“网络连通性解决的不正是距离问题吗?” 我进一步解释道 “长春家附近有个小卖店,我时常想着买一架沃尔玛超市卖的那种遥控直升机,操控它去买烟…但直到现在,确实如你所说,还是人送,所以我觉得这种进步没什么大不了的。” (这个说法显然是给孩子讲的,我在文末会提到,人已经沦为了算法的执行者,和机器没有区别,而不是反过来,让机器试图和人没有区别)

事实上,上一段我所谓的 “操控遥控直升机买烟” 和 “送外卖的骑着电瓶车送餐” 意思一样,货品不会自己走,无人机也不会自己找地方,所以总需要一个人来控制货品到达收货人手里,我确实觉得迄今为止的互联网没什么大不了的,它只是集约了人力而已。

我只能这样讲,因为小孩子喜欢很酷的东西,他们喜欢无人机根据人的遥控去送货胜于人根据算法的指令去奔波,后者在他们看来一点意思都没有,但显然主角已经变了,人遥控无人机的主角是人,而外卖员送货的主角则是系统。
在这里插入图片描述

回到家里,我再次给女儿展示了 切血糕的篦子 并惊叹着鉴赏它,我告诉她,在互联网领域,正是一个类似的东西正在把我们从互联网的手工业田园牧歌时代带进机器大工业时代,没错,这个转变正是现在。我们把田园牧歌时代想象成创业者自己干活做 poc,大工业时代则对应创业者开始雇佣专业工人劳动了。

我进一步讲了三原色组成了像素点,cpu 如何将这些三原色数据一个个搬入显存,就像卖血糕的师傅一片片精工切割血糕片一样展示着精湛的技术,然后我说这种 “技艺” 没有扩展性,随后描述了 gpu 将这些像素数据一次性推入显存的过程,就像卖血糕的师傅拿出那个篦子,轻轻一推就切出了所有的血糕片。

4000 人吃 1 吨拉面怎么搞?要派出多少拉面师傅,耗费多少人工?1 吨拉面如何煮,如何在短时间内盛出来,需要多少锅?即使上压面机也不行,因为下面条的环节依然不好并行化,面条泡久了会坨。这解释了为什么大规模食堂的碳水主食都是米饭而不是面条。

同样,手洗 1000 个碗需要多少人工以及多少工时,而使用洗碗机只需要做大一点即可。我解释到,手工操作类似 cpu,机器批量操作类似 gpu,jpu。诚然,cpu 可以完成很多复杂的逻辑,但做那些重复性的简单事,太慢了。

没有 gpu(泛指,包括所有类似的 pu),即使堆积 cpu 对于扩展性也无济于事,注定无法大规模生产,处理以及消费数据。

我进一步举了个例子,依然是切血糕。前面讲过,那么大一块血糕,手工刀切很耗时,如果要切 30 片,就要切 30 刀,如果请 30 个人拿 30 把刀一起切呢?首先 30 个人请过来只为切一刀,过于昂贵,其次,那么多人围着一块血糕,需要先排顺序确定好谁切那个位置,即使如此,一起下刀,还是容易互相切到手。我让女儿明白,多 cpu 处理简单重复的并行任务并不是好主意,同步开销大,性价比低。多 cpu 适合处理逻辑无关的任务,比如 cpu 1 切血糕,cpu 2 切豆腐,cpu 3 拉面,… 最后做成一顿饭。

但即使这样,不如 cpu 1 控制一个 gpu 1,指示 gpu 1 如何切血糕,切几片,每片多厚,同理,cpu 2 指示 gpu 2 切豆腐…如此下来,cpu 只负责当经理发指令,gpu 负责干活,就不仅仅是做一顿饭了,而是开一家大食堂了。

谈到互联网革命的断代,我很自信地认为我们当前正在从田园牧歌走向机器大工业时代,因为作为底层一线工人,几年前身边的同行还在用类似 netfilter,bypass 等软件技术来优化数据处理路径,可最近几年大家纷纷开始往并行化硬件上 offloading 软件功能,各种新硬件层出不穷,类似 gpu 的硬件承包了大多数网络数据平面的操作,在计算和存储领域,类似 gpu 的硬件参与的任务呈现爆发式喷发。

我这样讲可能孩子们不太懂,但我的总结很简单,这意味着互联网现在逐渐开始有能力 “干重活” 了。

cpu 主导的互联网多重活儿无能为力,彼时的重活儿仅体现在采用了专业硬件的核心转发,这些转发节点并不生产和加工数据,它们只是数据的搬运工。 当数据中心引入更多专有硬件后,事情就变了。

区块链,chatgpt 这些耗电大户此前讲过了,今日不赘述,我对重体力互联网对能源消耗的理解,参见 互联网和能源。

cpu 互联网只是数据的仓库,无论是你浏览网页,看视频,玩游戏,所有的内容几乎都来自于 “录入”,你上传一张图片,图片就保存在某个地方,当人们想看它时,它就从这个地方传输到人们眼前的屏幕上,互联网核心只看管数据,却无力触动数据,因为算力不行。

算力足够后,互联网核心就可以 “分析” 多个人上传的多份数据,从中 “学习”,并 “生成” 新的数据。比如一个典型的例子,每天游客会上传很多关于不同旅游景点不同角度的照片,互联网就可以自动根据这些照片生成这些景点的全息 3d 影像,这背后的力量就是算力,而算力由 Xpu 展示。

有了重体力劳动能力的互联网将会迅速变强变聪明,因为它可以消化并吸收更多的数据,而数据与数据之间的关系意味着知识。

话题终于回到了开头和女儿的对话,我就自己随便写写。只要有合适的载体,机器人也好,无人机也好,系统本身就能算出从超市到家的路径,并且将货品送达,不再需要人工介入。

但我抱怨的显然不是人工,因为人在整个过程中已经仅仅成了 “算法的执行者”。我下单后,系统会生成一系列的 action,然后分别由店家,外卖员以及我本人来执行这些 action,我们都是系统命令的执行者。人和机器人,无人机一样,只是执行者。

如果我的手机显示 “还有 1 分钟送达” 并被我看到,此时外卖员哪怕正想去路边店里买包烟,但迫于害怕超时,只能放弃买烟的念头,赶紧给我送完货后再去买,然而可能紧接着就会收到提示 “在 3 分钟内去 xxx 取货,送至 yyy”。同样,由于送货时间确实存在统计波动,我自己在收到货之前也无法安排时间,搞得参与者均非常紧迫。为避免被算法奴役,外卖架和快递柜是个好 buffer,值得推广。

随着互联网进入大工业时代,互联网将 “学会” 更多的关联,与之相关的 action 已经不再是慢吞吞的人所能执行的了,互联网每时每刻都在 “照顾” 着每个人以及被每个人 “照顾”,它会生成无数份饮食建议和出行建议,而这些建议均来自于当事人此前的历史记录,当事人将数据喂养互联网的同时,互联网也在喂养几乎所有人。

我又讲了一个网上办身份证的例子。

如果你的身份证丢了,互联网时代的你需要在网上提交一下挂失和补办,然后过段时间就有快递员将新身份证送你手上了,你也不必关心中间发生了什么?是这样吗?

其实这只是让你少跑几趟罢了,对端仍然会有个人收到你的申请,然后此人需要用鼠标键盘进行一系列操作,由工人制证,再交给快递方邮寄,这个不是真正的互联网操作,这只是办公自动化。那么真正的互联网如何补办身份证?

真正的互联网根本不需要实体身份证。

进一步思考,摆脱类似 100 多年前红旗法案的东西,有多少我们认为通过互联网非常容易办却根本不需要再办的事情,身份证等证件只是其一,类似的例子还有取火车票报销,打印登机牌,运输单邮寄,门票领取等实体件儿。

最后,我举了一个例子提示不要走火入魔,还是与切血糕的篦子有关。

我必须自我检讨,我承认当我看到这个精巧的篦子后惊呆了,于是我马上就想到了稍微加工一下就可以切豆腐,切菜,可后来我又反思,发现我犯了错误。切血糕需要这个篦子是因为切血糕对刀功要求高,而切豆腐和切菜对刀功要求并不是必须的,所以为什么要做一个可用可不用的东西呢?

可以看到,如今轰轰烈烈的卷途中,很多的 Xpu 都不是必须的,但却消耗了大量的人力和薪资,这些卷事大多由小经理带队画饼烧钱,而这些钱如果花在更有意义的事上,大家都会非常舒服且具有成就感。在我看来,jpu 是必须的,j 是 “经理” 的缩写,pu 是 processing unit 首字母缩写,大意就是 “经理处理单元”,一个流程可以劈断一个经理的那种物件儿,刚需。

浙江温州皮鞋湿,下雨进水不会胖。

相关推荐

  1. FastAPI 是

    2024-03-16 08:46:01       37 阅读
  2. 碎片化互联网

    2024-03-16 08:46:01       58 阅读
  3. 元旦假期第二天:家务

    2024-03-16 08:46:01       52 阅读
  4. layui.use是

    2024-03-16 08:46:01       52 阅读
  5. tomcat到底是

    2024-03-16 08:46:01       33 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-16 08:46:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-16 08:46:01       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-16 08:46:01       87 阅读
  4. Python语言-面向对象

    2024-03-16 08:46:01       96 阅读

热门阅读

  1. Level 2 行情数据存储处理

    2024-03-16 08:46:01       45 阅读
  2. CRC校验(FPGA实现)

    2024-03-16 08:46:01       45 阅读
  3. 【nuget】如何移动 nuget 缓存文件夹

    2024-03-16 08:46:01       38 阅读
  4. Node.js 中的 HTTP 模块教程

    2024-03-16 08:46:01       39 阅读
  5. 个人商城系统开源(注册)

    2024-03-16 08:46:01       36 阅读