有人表示自己一半的工作已经可以由它替代了!
就在昨天,Anthropic深夜发布了下一代旗舰大模型Claude 3.5 Sonnet。
据称,Claude 3.5 Sonnet不仅在评估中胜过GPT-4o,还保持了作为「中杯」的最优性价比,超过了自家的Claude 3 Opus。
如今,Claude 3.5 Sonnet已经面向全球开启免费试用了。
在费用上,Sonnet处理每百万输入token仅需3美元,每百万输出token仅为15美元。
对比之下,GPT-4o的每百万输入token收费5美元,每百万输出token为15美元,在价格上可以说是不相上下。正式对打时,各家可以说是已经都压低到了成本价。
前OpenAI对齐团队负责人Jan Leike表示,我喜欢Sonnet新模型。我经常要求它向我解释ML论文。虽然不一定全对,但可能比我略读要好,而且速度也快得多。自动对齐研究越来越近了…
有网友同样表示,「我有一半的工作都可以由Claude 3.5 Sonnet来完成,我真是太兴奋了」。
Anthropic的产品经理Michael Gerstenhaber将新模型称之为「世界上最智能的模型」。
他表示,「我们正处于这个行业寒武纪大爆发的开端」。
今年晚些时候,Claude 3.5 Haiku和最强版Claude 3.5 Opus将会陆续推出。
模型厂商们是彻底卷起来了!
网友实测
Claude 3.5 Sonnet发布之后,在全网掀起轩然大波,网友们纷纷上手开启一波测试。
10倍编码速度惊人
先来看看Claude 3.5 Sonnet写代码的速度有多可怕。
网友仅在一次对话中,就用threejs+cannonjs创建出一个3D太阳系模型,包含了物体和碰撞效果。
另一个网友称,使用Claude 3.5 Sonnet进行编码比GPT-4,或任何其他大型语言模型效率高10倍。全新的Artifacts功能,可以在聊天旁边生成和运行代码,简直令人惊叹。
没有什么比使用Claude 3.5 Sonnet一次性编写一个程序,来解密维吉尼亚密码更棒的事了。
许多网友纷纷夸赞Claude 3.5 Sonnet速度快到起飞。
2分钟一个小游戏
一位开发者直接用了不到2分钟,做出了一个戴着太阳镜的小狗吃骨头的游戏。
另有人花了3分钟的时间,做出了马里奥克隆版,并且为角色提供了动画效果。
还有另一款「原创」游戏Color Cascade。
用2分钟创建一个蛇梯棋游戏。
网友表示,「我可以通过新的Artifacts功能实时查看代码并玩游戏。使用Claude的编码体验比GPT-4和Gemini好10倍」。
这位网友用Sonnet做了一款乒乓球游戏。
不像ChatGPT,它没有用到编码解释器。在这个过程中,我们可以制作文档、笔记和其他内容,其中一个选项的html/jss。
神经网络可视化
有人还去做了可视化深度学习,不过因为消息限制,不得不暂停。
下面是用动画效果解释反向传播的工作原理。
重建3D「模拟矩阵」
Claude 3.5 Sonnet是第一个能在首次尝试中,重现电影《黑客》中「数据流」3D场景的模型。
而且,在制作恐怖游戏上,Claude 3.5 Sonnet设计的3D结构比Opus更好。
SVG效果图
Claude 3.5 Sonnet可以画出独角兽SVG图。
它甚至可以生成芯片制造工艺流程示意图。
「井字棋」游戏失败
OpenAI研究科学家,德扑之父使用新模型之后表示,
像GPT-4o(现在还有Claude 3.5 Sonnet)这样的前沿模型,在某些方面可能达到了「聪明的高中生」的水平,但它们在像「井字棋」这样的基本任务上无法完成。
人们曾希望原生的多模态训练能够有所帮助,但事实并非如此。