AI资讯新闻榜单内容搜索-AR

让GPT-4o准确率大降，这个文档理解新基准揭秘大模型短板

在文档理解领域，多模态大模型（MLLMs）正以惊人的速度进化。从基础文档图像识别到复杂文档理解，它们在扫描或数字文档基准测试（如 DocVQA、ChartQA）中表现出色，这似乎表明 MLLMs 已很好地解决了文档理解问题。然而，现有的文档理解基准存在两大核心缺陷：

来自主题: AI技术研报

9865 点击 2025-05-25 11:44

深度｜对话AI独角兽Character.AI CEO：最佳应用还未被发明出来，AI领域现状类似炼金术，没人确切知道什么会奏效

对话AI独角兽Character.AI CEO：最佳应用还未被发明出来，AI领域现状类似炼金术，没人确切知道什么会奏效

来自主题: AI资讯

9019 点击 2025-05-24 16:01

Plaud AI CEO 许高：全球出货近 70 万台设备背后，Plaud 想用 AI 重塑对话价值链

5 月 23 日，Plaud AI 创始人许高与《时代》杂志特约编辑 Charlie Campbell 在 Beyond Expo 展开了深度交流 —— 围绕“语音交互与人类智慧传递”、“生成式 AI 在工作流中的价值”、“个性化模型的演进”以及“AI 安全与地缘政治挑战”等多个维度展开探讨，还分享了 Plaud AI 在消费级 AI 硬件与人机协同方面的最新进展与长期愿景。

来自主题: AI资讯

11970 点击 2025-05-24 11:08

巧妙！一个传统技术让国产视觉基础模型直接上大分

咱就是说啊，视觉基础模型这块儿，国产AI真就是上了个大分——Glint-MVT，来自格灵深瞳的最新成果。Glint-MVT，来自格灵深瞳的最新成果先来看下成绩——线性探测（LinearProbing）：

来自主题: AI技术研报

9687 点击 2025-05-23 15:18

AI版Office全网首测，键盘鼠标彻底退休！打工人沸腾

这次，引领者又是中国公司！在5月中旬拿到GAIA榜首的这个AI版office，直接结合了Deep Research和通用Agent两大神器的优点，从此office三件套彻底进入第四代。

来自主题: AI资讯

6969 点击 2025-05-23 12:32

比Gemini Diffusion更全能！首个多模态扩散大语言模型MMaDA发布，同时实现强推理与高可控性

普林斯顿大学与字节 Seed、北大、清华等研究团队合作提出了 MMaDA（Multimodal Large Diffusion Language Models），作为首个系统性探索扩散架构的多模态基础模型，MMaDA 通过三项核心技术突破，成功实现了文本推理、多模态理解与图像生成的统一建模。

来自主题: AI技术研报

10481 点击 2025-05-22 17:30

速递｜AI排行榜独角兽诞生：LM Arena获1亿美元融资，估值6亿美元能否洗刷"刷分"指控？

LM Arena 是一个众包基准测试项目，各大 AI 实验室依赖其测试和推广自家 AI 模型。据彭博社报道，该项目已在种子轮融资中筹集 1 亿美元，估值达 6 亿美元。

来自主题: AI资讯

9738 点击 2025-05-22 16:00

从 Manus、Genspark 到 Lovart、ListenHub、Medeo：一张图谱看懂华人 Agent 浪潮

如果用一句话为 2025 年写下注脚，那它不会是某个技术名词，而更像是一种哲学上的转变：“这一年，我们不再是孤立地使用软件，而是与智能的代理人（Agent）共舞，它们正悄然重塑我们的工作与生活。”

来自主题: AI资讯

12464 点击 2025-05-22 14:42

全球智能体榜单新SOTA！中国公司登顶，Office三件套一键生成，全程可控可溯源，打工人直接拿来用

左超Manus，右跨Genspark，GAIA榜单上又一家中国公司登顶！

来自主题: AI资讯

11316 点击 2025-05-22 14:23

北森酷学院发布新一代AI Learning平台，企业学习开启Agents时代

市场的大变革，孕育着大机会，创新者往往能够抓住机会、创造并引领未来。5 月 21 日，行业头部的一体化 HR SaaS 平台北森控股（股票代码：09669.HK）在北京隆重举办 “AI Learning 产品发布会”，宣布完成酷学院收购，并同步推出基于 AI 大模型的新一代学习平台 ——AI Learning

来自主题: AI资讯

8227 点击 2025-05-22 14:04