新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude

2025-07-12 17:51:11 - 风台专

8月2日，新王新超lmsys官方在推特发布一则消息，登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版（0801）在Chatbot Arena排名登顶，超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来，OpenAI第二次让出Chatbot Arena的登基度更知乎带货博主翻车合集Overall ranking宝座。

新王登基，新王新超Gemini 1.5 Pro再度更新，登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版（0801）在Chatbot Arena测试一周后。获得了超过12，登基度更000个社区投票，新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧，新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基，新王新超Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版（0801）不仅在综合表现上极为突出，在各个细分领域上也有着出色的表现。它在数学方面排名前三，护士下班后被全集指令遵循排名前二，编码排名前五，硬提示（英语）排名前五。

Gemini 1.5 Pro 实验版（0801）具有强大的多语言能力，在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上，也能看出Gemini 1.5 Pro 实验版（0801）实力强劲，对阵 GPT-4o 的胜率为 54%，对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

前OpenAI的开发者，现Google AI Studio的产物负责人Logan Kilpatrick火速转发，向大家宣布Gemini 1.5 Pro 实验版（0801）目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息，祝贺Gemini 1.5 Pro 实验版（0801）能够在极具竞争力的榜单中拿下第一，并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发，对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪，也很期待未来能看到其他更好的模型。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

听闻这则消息，其他从业人员也纷纷发来祝贺。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片，并总结道，Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象，Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力，也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线，希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法，欢迎评论区留言分享~雷峰网(公众号：雷峰网)雷峰网

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

- END -

5

大模型「点火」，AI for Science 提速

大模型「点火」，AI for Science 提速

2025-07-12 17:37

在生产环节中，95% 是一个分水岭。以人为对照标准，人工的准确率在 92% 至 98% 之间，因此，行业对机器容忍度的判别标准取之中位数，未达到 95% 的部分，无论是 80% 乃至 90% 的准确率

AI 搜索向左，搜索 OG 向右

AI 搜索向左，搜索 OG 向右

2025-07-12 17:30

作为 AI 世界的领头羊，OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。这把火原本由 Perplexity 引燃，在美国烧及 Google 和微软，在中国引发了百度、360

边缘人工智能提供商 Gcore 获 6000 万美元融资；马斯克开训最大 AI 集群，目标年底开发全球最强 AI丨AI情报局

边缘人工智能提供商 Gcore 获 6000 万美元融资；马斯克开训最大 AI 集群，目标年底开发全球最强 AI丨AI情报局

2025-07-12 17:20

今日融资快报边缘人工智能、云、网络和安全解决方案提供商Gcore获6000万美元A轮融资Gcore 的云基础设施专为边缘而构建，为边缘的 LLM 训练和人工智能应用程序的推理提供支持。融资由Warga

达摩院跨入 AIGC 深水区，发布一站式 AI 视频创作平台「寻光」

达摩院跨入 AIGC 深水区，发布一站式 AI 视频创作平台「寻光」

2025-07-12 17:17

年初，OpenAI 推出文本-视频生成模型 Sora，只需输入提示文本描述，或输入一张图片，Sora 就能生成类似电影大片的逼真场景视频，前所未有的新奇观感，让大众直呼「现实不存在了」。惊叹之余，So

共襄学术盛宴，共话产业发展，2024中国图象图形大会在西安圆满落幕

共襄学术盛宴，共话产业发展，2024中国图象图形大会在西安圆满落幕

2025-07-12 17:08

2024年5月24-26日，中国图象图形大会CCIG 2024）在西安隆重召开。本次大会由中国图象图形学学会主办，空军军医大学、西安交通大学、西北工业大学承办，陕西省生物医学工程学会、陕西省图象图形学

JetBrains与阿里云战略合作发布JetBrains AI Assistant：聚焦中国市场开发者，实现开发效率代际提升

JetBrains与阿里云战略合作发布JetBrains AI Assistant：聚焦中国市场开发者，实现开发效率代际提升

2025-07-12 16:50

9月19日，全球知名的软件开发工具提供商JetBrains在2024云栖大会上正式发布基于阿里云通义大模型的JetBrains AI Assistant，标志着JetBrains在完善其开发工具产品生

OpenAI 又一位联创离职，公司动荡仍在持续？

OpenAI 又一位联创离职，公司动荡仍在持续？

2025-07-12 16:43

北京时间8月6日早上八点，OpenAI联合创始人John Schulman在twitter发文，宣布从OpenAI离职，加入Anthropic深入研究AI对齐。在twitter发布的这封离职信中，Jo

人形机器人「星尘智能」获数千万美元Pre

人形机器人「星尘智能」获数千万美元Pre

2025-07-12 16:34

图片来源：星尘智能近日，AI机器人公司星尘智能Astribot）宣布完成数千万美元Pre-A轮融资，由经纬创投领投，道彤投资及清辉投资等产业资本跟投，老股东云启资本跟投。华兴资本担任独家财务顾问。本轮

博搏云的生态蓝图：稳固住AGI全栈服务商的重要阵地

博搏云的生态蓝图：稳固住AGI全栈服务商的重要阵地

2025-07-12 15:42

生态是一切产业发展的基础。完善的生态可以加速知识、技术、应用场景的积累，使创新成果更快地转化为产品，连接产业链上下游，也可以为人才的培养和流动提供良好平台。中国已被视为全球AI领域最具竞争力的国家。人

AI 图像生成平台 LiblibAI 融资总额达数亿元；Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局

AI 图像生成平台 LiblibAI 融资总额达数亿元；Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局

2025-07-12 15:22

今日融资快报AI 图像生成平台 Liblib AI 融资总额达数亿元 AI图像生成平台 LiblibAI哩布哩布AI一年内，已经完成了三轮融资，总金额达数亿元人民币，天使轮投资方为源码资本、高榕创投和

徐凌杰创立魔形智能，国际头部GPU高管加盟

徐凌杰创立魔形智能，国际头部GPU高管加盟

2025-07-12 15:13

导语：创业方向是做大模型基础设施。作者丨马蕊蕾编辑丨陈彩娴近日，前「壁仞科技」总裁徐凌杰，离开壁仞4个月后，于2024年6月份，正式成立了上海魔形智能有限公司。据悉，徐凌杰毕业于上海交通大学电子工程系

Groq获贝莱德3亿美元投资，最新估值22亿美元；Hayden AI获9000万美元C轮融资丨AI情报局

Groq获贝莱德3亿美元投资，最新估值22亿美元；Hayden AI获9000万美元C轮融资丨AI情报局

2025-07-12 15:07

融资快报Groq 获贝莱德 3 亿美元投资，最新估值 22 亿美元Groq 创始人Jonathan Ross，毕业于纽约大学，曾在谷歌 X 实验室参与多个项目，包括 Tensor Processing