兵贵神速！Grok-1.5发布！剑指GPT-4

2024-03-29 19:10:04
开发
40

前言

就在今天，马斯克的xAI又发布了最新款的大模型，距离Grok-1发布才刚过去11天。马斯克看来是真的铁了心的要进军大模型了。不过话又说回来了，难怪把Grok-1开源，原来后面憋了个大的

一、推理能力和计算能力up！

在xAI的官网上，首当其冲的就是Grok-1.5的发布页，

官方刻意强调了此次升级的两个关键点，一个方面是最高支持128k的上下文输入，

另一方面是全面增强了Grok-1.5的推理能力和数学计算能力。

官方目前一共发布了4个Grok-1.5的基准测试，包括：

MMLU（大规模多任务语言理解）

MATH（数学基准测试）

GSM8K（小学数学问题集）

HumanEval（编程问题数据集）

其中数学基准测试，相较于上一代提升了近一倍，无限接近于GPT-4的水平，但距离Claude3 Opus（超大杯）还具有不小的差距

在 GSM8K 基准测试中的成绩表现的比较优异，已经能和当前头部的大语言模型相媲美了

值得一提的是在HumanEval的基准测试中Grok-1.5已经超过了GPT-4，和除Claude3 Opus外的所有模型

要知道距离Grok-1的发布仅仅过去了才11天，更甚的是Xai成立也才不到一年的时间，真不愧是背靠马斯克的团队，实力太雄厚了！

二、超长文本上下文理解能力up！

Grok-1.5另一个更新的功能就是支持在上下文窗口中能处理128k的token，相较于上一代提升了16倍

除此之外，Grok-1.5 建立在基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架之上，简而言之就是这个训练堆栈能够以更小的投入，获得更强的训练效果

xAI的自定义训练编排器，会自动检测有问题的节点，并直接将它删除

优化了检查点、数据加载和训练作业重启的逻辑，能够最大限度的减少发生故障的停机时间

另外，xAI还在官网上透漏了他们将会在近期开放Grok-1.5的测试给部分用户，并且在未来的几天会推出一些新的功能。

总结

xAI如此玩命的干，不知道Anthropic和OpenAI有没有感觉到压力，毕竟xAI是直接由马斯克领导的团队，在X上很多网友都喊话奥特曼，让它尽快推出GPT-5，还有网友认为，xAI在未来一定是在大模型领域的领军人物。当然这种场景一定是大家喜闻乐见的，因为这些大模型公司干的越凶，最后我们用的就越爽

原文地址:https://blog.csdn.net/weixin_47201270/article/details/137150348 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1773668945467936768.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

兵贵神速！Grok-1.5发布！剑指GPT-4

2024-03-29 19:10:04 41 阅读
超越GPT-4V！马斯克发布Grok-1.5 With Vision

2024-03-29 19:10:04 35 阅读
【LeetCode-剑指offer】--19.验证回文串II

2024-03-29 19:10:04 57 阅读
剑指Offer题目笔记19（二分查找）

2024-03-29 19:10:04 38 阅读
【剑指Offer记录】13_机器人的运动范围

2024-03-29 19:10:04 32 阅读
剑指offer

2024-03-29 19:10:04 91 阅读
《剑指offer》

2024-03-29 19:10:04 57 阅读
【LeetCode-剑指offer】--15.找到字符串中所有字母异位词

2024-03-29 19:10:04 51 阅读
苹果意将Gemini引入iPhone；英伟达发布新AI GPU；Grok正式开源

2024-03-29 19:10:04 33 阅读
【AIGC调研系列】Grok-1.5v与Gpt-4v的效果对比

2024-03-29 19:10:04 32 阅读

最近更新

题解 - 序列

2024-03-29 19:10:04 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-03-29 19:10:04 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-03-29 19:10:04 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-03-29 19:10:04 101 阅读
NoSQL之Redis非关系型数据库

2024-03-29 19:10:04 101 阅读
2024.7.22 作业

2024-03-29 19:10:04 98 阅读
GDB调试正在运行的程序

2024-03-29 19:10:04 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-03-29 19:10:04 85 阅读
在Django里面运行非项目文件

2024-03-29 19:10:04 82 阅读
SSD基本架构与工作原理

2024-03-29 19:10:04 87 阅读
在誉天学习完HCIE就业吗？

2024-03-29 19:10:04 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-03-29 19:10:04 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-03-29 19:10:04 86 阅读
go 协程池的实现

2024-03-29 19:10:04 89 阅读
Shell脚本循环语句与函数

2024-03-29 19:10:04 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-03-29 19:10:04 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-03-29 19:10:04 85 阅读
四大引用——强软弱虚

2024-03-29 19:10:04 86 阅读
Python语言-面向对象

2024-03-29 19:10:04 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-03-29 19:10:04 85 阅读
网站安全-CDN篇

2024-03-29 19:10:04 89 阅读