AI资讯新闻榜单内容搜索-Arena

全球最大AI榜单塌房！52%高分答案全是胡扯，硅谷大厂集体造假？

谁能想到，AI界最权威的大模型排行榜，竟然是个彻头彻尾的骗局？最近，2025年底的一篇名为《LMArena is a cancer on AI》的文章被翻了出来。登上了Hacker News的首页，引起轩然大波！

来自主题: AI资讯

9095 点击 2026-01-09 11:35

网民票选AI王者，LMArena一夜变17亿美元独角兽！

一场AI界的《创造101》火了！LMArena让你盲投选出最强AI，三年从校园项目逆袭，刚刚融1.5亿美元，估值飙到17亿美元。众包投票挑战专家权威，争议四起，却已成行业标杆。你的票，就能决定下一个AI顶流！

来自主题: AI资讯

7605 点击 2026-01-07 18:38

美国模型长期霸榜的LMArena，出现了一个国产模型

时间过得太快了，一转眼就来到了 2025 年的年底。我们距离 2026 年只剩下了 8 天。回看 AI 模型和产品突飞猛进这一年，中美两家 AI 阵营的行业发展路径有了挺大的区分，大家的关注度不再是单一模型、单一能力，而是“模型+工程+场景”的复合能力。这个变化在年底愈发明显。

来自主题: AI资讯

10304 点击 2025-12-25 14:17

神秘模型Grok 4.20 AI炒股夺冠！只有它赚钱，吊打Gemini 3和GPT-5.1

在Alpha Arena 1.5赛季的美股真金白银实盘中，Grok 4.20完胜GPT-5.1和Gemini 3.0 Pro等一众顶流模型，在对手全线亏损的情况下，独自斩获了12.11%的正收益。成功背后的秘密是Grok对X的推文反映的市场情绪的及时精准捕捉。

来自主题: AI资讯

8452 点击 2025-12-08 10:30

36个月大逆转！他带着谷歌AI杀回来了，下一步世界模型

ChatGPT发布距今已近36个月，面对OpenAI的领先，哈萨比斯带领谷歌AI全面反攻，通过新发布的Gemini 3强势回归。Gemini 3在LM Arena等多个模型榜单登顶，表现优于GPT-5及其他模型，上演了一场完美逆袭。

来自主题: AI资讯

7923 点击 2025-11-24 10:18

马斯克Grok 4.1双冠封王，爆冲第一！AI王座一夜易主

AI新王来了！马斯克Grok 4.1静默上线，一夜之间登顶LMArena，Gemini 2.5 Pro却被按在地上摩擦。主打情商智商在线，算力又扩增一个数量级。这一次，Grok 4.1一共放出了两大版本：Grok 4.1 Thinking和Grok 4.1。

来自主题: AI资讯

9285 点击 2025-11-18 11:24

太卷了！专属Coding的新一代Arena榜单来了，有国产模型登上榜首

大模型编程最近太猛了。

来自主题: AI资讯

12517 点击 2025-11-14 10:59

全球第二、国内第一！最强文本的文心5.0 Preview一手实测来了

「Baidu is back」，在业界权威大模型公共基准测试平台 LMArena 发布最新一期文本竞技场排名（Text Arena）之后，有人发出了这样的惊呼。根据 11 月 8 日凌晨 LMArena 的最新排名显示，百度文心最新模型 ERNIE-5.0-Preview-1022（文心 5.0 Preview）在文本榜单上一举跃居全球并列第二、国内第一。

来自主题: AI资讯

9777 点击 2025-11-10 09:18

高智商 ≠ 高财商？50天实盘测试：LMArena 高分王者也可能是「韭菜」

「在大模型热潮中，如何真正评测它们的智能？」

来自主题: AI技术研报

7300 点击 2025-11-03 14:17

谁是AI之王？聊聊备受争议的AI评测与崛起的LMArena

当AI模型排行榜开始被各种刷分作弊之后，谁家大模型最牛这个问题就变得非常主观，直到一家线上排行榜诞生，它叫：LMArena。在文字、视觉、搜索、文生图、文生视频等不同的AI大模型细分领域，LMArena上每天都有上千场的实时对战，由普通用户来匿名投票选出哪一方的回答更好。

来自主题: AI资讯

9642 点击 2025-11-03 09:41