反超 DeepSeek？马斯克「钞能力」砸出来的 Grok 3 终于上线了

2025-07-11 12:23:45 - 事报

2 月 16 号，反超马斯克在 X 上发布了一条自家 Grok 3 模型的克钞发布预告。

并配文“地球上最聪明的砸出k终 AI”要来了。

北京时间 2025 年 2 月 18 日中午，于上马斯克如约带领着 xAI 的反超工程师和研究团队开启了 Grok 3 的首发实况。

这次发布会主要分为三个部分，克钞介绍了 Grok 3 在训练上比 Grok 2 多投入了 10 倍的砸出k终计算资源，解锁了更强大的于上计算能力，展示了基于 Grok 3 的反超 AI Agent，展现了 xAI 团队在自主智能体领域的克钞最新进展。

反超 DeepSeek？砸出k终马斯克「钞能力」砸出来的 Grok 3 终于上线了

各项能力一骑绝尘

“我们非常高兴能够推出 Grok3，我们认为，于上在很短的反超时间内，它的克钞功能比 Grok2 强大一个数量级。这要归功于一支不可思议的砸出k终团队的辛勤工作，我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上说道。

马斯克还透露，Grok 3 由 Colossus 超级计算机训练完成，这台计算机是在短短八个月内建成的，搭载了 10 万颗英伟达 H100 GPU，提供了超过 2 亿 GPU 小时的计算资源——是 Grok 2 的10倍。

据 xAI 团队介绍，xAI 最开始搭建这个 10 万 GPU 集群用了 122 天，后续拓展到 20 万 GPU 集群仅用了 92 天。显著的算力提升让 Grok 3 能够更高效地处理庞大信息集，缩短训练时间。随即他们便晒出了一组和 ChatGPT 的信息对比图，并表示虽然 Grok 起步较晚，但在 MMLU 得分上以超快地速度追上了 ChatGPT。

反超 DeepSeek？马斯克「钞能力」砸出来的 Grok 3 终于上线了

并且 Grok3 在 LMSYS（大模型竞技场）中的排名也是一骑绝尘。

反超 DeepSeek？马斯克「钞能力」砸出来的 Grok 3 终于上线了

其中 Grok-3 和 Grok-3 mini 在多方面性能上都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手。

发布会列出的信息显示，Grok-3 和 Grok-3 mini 在数学、科学和编程的基准测试中，表现超越了所有主流模型，包括 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro等。

而 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 这两个版本，则凭借强大的推理能力，超越了像 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。

反超 DeepSeek？马斯克「钞能力」砸出来的 Grok 3 终于上线了

此外，xAI团队还现场演示了一个任务，要求Grok-3在现场生成一段关于太空发射的3D动画代码。在大约两分钟的思考后，Grok 3生成了可直接运行的Python代码，成功展示了可以运行的3D动画。

除此之外团队还要求 Gork-3 制作一款类似于俄罗斯方块和宝石迷阵的游戏。在Grok-3 思考了数分钟后，给出了答案。

最后，xAI 团队演示了一个全新的产物，基于 Grok 3 的搜索引擎 —— DeepSearch 。

它不仅能够搜索网页并查找现有资料，还能“推测客户的真实意图”并进行思考。通过交叉对比多个信息源，它能够确保“返回最准确的答案”。

Grok 3 搅动 AI 大模型格局

实况结束后，不少网友纷纷发声。

AI 大牛卡帕西总结了一下自己的“先行版”使用体验：

首先 Grok 3 的“思考”功能非常先进，能够出色地解决复杂问题，如创建《卡坦岛》风格的棋盘游戏网页。相比之下，其他顶级模型（如 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude）未能解决相同问题。除此之外，Grok 3 也能尝试解决如黎曼假设等难题。

其次 Grok 3还具备类似“深度研究”的搜索功能，能够提供高质量的研究问题答案。例如，它能够回答 Apple 新品发布、Palantir 股价上涨等问题。但在某些情况下，它会错误地产生幻觉（如错误的URL或不准确的事实）。

最后在测试一些简单的“陷阱”问题时，Grok 3 表现良好，能够正确回答一些逻辑谜题。但在幽默和道德问题方面，它仍然存在一些问题，如生成重复笑话和对复杂伦理问题过于敏感等。

但总的来说 Grok 3 整体表现接近 OpenAI 的 o1-pro 模型，并略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。

反超 DeepSeek？马斯克「钞能力」砸出来的 Grok 3 终于上线了

Imarena.ai 官方更是在经过测试后发文称：

Grok-3 是首个突破 1400 分的模型，在所有类别中排名第一，这是一个越来越难以实现的里程碑。

反超 DeepSeek？马斯克「钞能力」砸出来的 Grok 3 终于上线了

更有网友直呼：Grok 3 可能是现实世界中在物理层面处理得最好的基础大语言模型了！当然也有网友在测试之后，认为 Grok 3 在编程方面并不是很擅长。

值得一提的是，Grok 3 第一批获得访问权限的人将首先从 X 上的 Premium+ 订阅者开始，而普通客户何时能用上，他们也并不清楚。

但基于网友们对 Grok 3 褒贬不一的评价，雷峰网(公众号：雷峰网)不禁猜测，这被 “钞能力” 风风火火砸出来的的 “no.1” 在权限全面放开之后会不会口碑两极反转，亦或是依旧好评如潮，稳坐 AI 大模型王座？

时间还早，让子弹再飞一会。

参考链接：https://x.com/i/broadcasts/1gqGvjeBljOGB?t=SX_aTsBoXc07lfSR_Aw8AQ&s=09

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

- END -

25552

今年将举办50多场演唱会鸟巢放歌引爆双奥场馆新热潮

今年将举办50多场演唱会鸟巢放歌引爆双奥场馆新热潮

2025-07-11 13:32

来源标题：今年将举办50多场演唱会鸟巢放歌引爆双奥场馆新热潮5月23日至25日，凤凰传奇连续三场鸟巢演唱会引爆歌迷热情，共吸引近19万观众到场，国家体育场再次成为欢乐的海洋。今年以来，汪苏泷、张惠妹

2025精英童模超级联赛情景背景曲《我命由我不由天》全网上线

2025精英童模超级联赛情景背景曲《我命由我不由天》全网上线

2025-07-11 13:29

来源标题：2025精英童模超级联赛情景背景曲《我命由我不由天》全网上线上海瑶娱文化童星艺人岳凌汐献唱2025精英童模超级联赛情景背景曲《我命由我不由天》全网上线。中国新生代全能童星岳凌汐再度携手精

黛兰娜线上分享系统盛大启动暨2025《中华才女大赛》璀璨启幕

黛兰娜线上分享系统盛大启动暨2025《中华才女大赛》璀璨启幕

2025-07-11 13:17

来源标题：黛兰娜线上分享系统盛大启动暨2025《中华才女大赛》璀璨启幕6月8日下午14时，优秀民族品牌黛兰娜在上海闵行区白金汉爵酒店隆重举行“黛兰娜线上分享系统启动暨2025《中华才女大赛

声在中国原创MV《梦的港湾》：漂泊终有归处静待梦的花开

声在中国原创MV《梦的港湾》：漂泊终有归处静待梦的花开

2025-07-11 13:02

来源标题：声在中国原创MV《梦的港湾》：漂泊终有归处静待梦的花开是谁乘着风，叩岁月的窗将你的微笑，遗落我梦乡那一串时光，珍珠般闪亮装点了每双眼眸……由中国文联港澳台办公

徽风皖韵绕濠江经典黄梅戏澳门上演

徽风皖韵绕濠江经典黄梅戏澳门上演

2025-07-11 12:52

来源标题：徽风皖韵绕濠江经典黄梅戏澳门上演新华社澳门5月25日电记者齐菲、刘刚）第五届粤港澳大湾区中国戏剧文化节之澳门—安徽黄梅戏文化周正在此间举行。中国戏剧梅花奖“二度梅&

《紫川之光明王》今日收官杨旭文刘宇宁张铭恩三兄弟重新收回远州失地

《紫川之光明王》今日收官杨旭文刘宇宁张铭恩三兄弟重新收回远州失地

2025-07-11 12:17

来源标题：《紫川之光明王》今日收官杨旭文刘宇宁张铭恩三兄弟重新收回远州失地今日，由爱奇艺出品，尚世影业、慈文传媒、灵河文化联合出品，张萌总导演，卫立洲导演，田良良、陈晨总编剧，杨旭文、刘宇宁领衔主

电影《恋曲尘封》今日上映细腻演技诠释动人情感

电影《恋曲尘封》今日上映细腻演技诠释动人情感

2025-07-11 11:49

来源标题：电影《恋曲尘封》今日上映细腻演技诠释动人情感日前，由吴有音导演/编剧，蒋雯丽、黄轩、黄小蕾、罗辑、林栋甫主演，马思纯特别出演的电影《恋曲尘封》发布今日上映海报。一本旧日记，一支素描笔，牵

上影节开幕大片“酱园弄”有何特别

上影节开幕大片“酱园弄”有何特别

2025-07-11 11:47

来源标题：上影节开幕大片“酱园弄”有何特别“那个复杂的年代有很多复杂人物的众生相，是一部两个小时的电影所无法承载的。经过不断打磨和审慎考虑，我还是决定用两部电影的形式，去呈现这个故事。&r

通义千问登顶Hugging Face榜首，国产开源大模型赶超Llama2

通义千问登顶Hugging Face榜首，国产开源大模型赶超Llama2

2025-07-11 11:44

【雷峰网(公众号：雷峰网)消息】上周五，全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜，阿里云通义千问Qwen-72B表现抢眼，以73.6的综合得分在所有预训练模型中排名

数字戏剧让每位观众都有“最优座位”

数字戏剧让每位观众都有“最优座位”

2025-07-11 11:39

来源标题：数字戏剧让每位观众都有“最优座位”XR戏剧《嵇康》拍摄现场XR戏剧《麦克白》拍摄现场传统剧场中，好座位总是稀缺资源——池座中区声效最佳，但视野受限；二楼看台能纵览全局

掌阅科技出品短剧《遮天》定档6月20日！AI技术与实拍画面深度结合

掌阅科技出品短剧《遮天》定档6月20日！AI技术与实拍画面深度结合

2025-07-11 11:39

来源标题：掌阅科技出品短剧《遮天》定档6月20日！AI技术与实拍画面深度结合近日，由掌阅科技、陕西文投影业、西安志和影视、成都星阅辰石、河北广电广告出品，海南有鹿影视文化、陕西大迈长宏影视等承制，辰东

电影《风云山林》：从江湖险路到革命征途

电影《风云山林》：从江湖险路到革命征途

2025-07-11 11:29

来源标题：电影《风云山林》：从江湖险路到革命征途秋风猎猎，马蹄声由远及近，金黄的陇东大塬在晨光中浮现出一抹肃穆与苍茫——电影《风云山林》便如此拉开了序幕。这部近日在电影频道首播