AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
ICML25|标点符号竟是LLM记忆核心!正确处理性能暴涨

ICML25|标点符号竟是LLM记忆核心!正确处理性能暴涨

ICML25|标点符号竟是LLM记忆核心!正确处理性能暴涨

近年来,大语言模型(LLM)的能力越来越强,但它们的“饭量”也越来越大。这个“饭量”主要体现在计算和内存上。当模型处理的文本越来越长时,一个叫做“自注意力(Self-Attention)”的核心机制会导致计算量呈平方级增长。这就像一个房间里的人开会,如果每个人都要和在场的其他所有人单独聊一遍,那么随着人数增加,总的对话次数会爆炸式增长。

来自主题: AI技术研报
8042 点击    2025-07-29 12:29
EvaLearn:AI下半场的全新评测范式!

EvaLearn:AI下半场的全新评测范式!

EvaLearn:AI下半场的全新评测范式!

在三个月前,OpenAI 研究员 Shunyu Yao 发表了一篇关于 AI 的下半场的博客引起了广泛讨论。他在博客中指出,AI 研究正在从 “能不能做” 转向 “学得是否有效”,传统的基准测试已经难以衡量 AI 的实际效用,他指出现有的评估方式中,模型被要求独立完成每个任务,然后取平均得分。这种方式忽略了任务之间的连贯性,无法评估模型长期适应能力和更类人的动态学习能力。

来自主题: AI技术研报
8035 点击    2025-07-29 10:54
抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

在人工智能模型规模持续扩大的今天,数据集蒸馏(Dataset Distillation,DD)方法能够通过使用更少的数据,达到接近完整数据的训练效果,提升模型训练效率,降低训练成本。

来自主题: AI技术研报
7876 点击    2025-07-29 10:12
超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

一句话概括:与其训练一个越来越大的“六边形战士”AI,不如组建一个各有所长的“复仇者联盟”,这篇论文就是那本“联盟组建手册”。

来自主题: AI技术研报
10603 点击    2025-07-29 10:09
一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!

一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!

一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!

又一家支持Claude Code的模型登场! GLM-4.5 在推理、代码、Agent(智能体)综合能力都达到了开源模型Top1水准,在单个模型中实现了推理、代码、Agentic等能力原生融合。

来自主题: AI产品测评
9891 点击    2025-07-29 10:06
被 OpenAI 点名后,智谱刚刚发布最新旗舰模型 GLM-4.5:国产最全能,一句话造出搜索引擎

被 OpenAI 点名后,智谱刚刚发布最新旗舰模型 GLM-4.5:国产最全能,一句话造出搜索引擎

被 OpenAI 点名后,智谱刚刚发布最新旗舰模型 GLM-4.5:国产最全能,一句话造出搜索引擎

就在刚刚,智谱正式发布最新旗舰模型 GLM-4.5。按照智谱官方说法,这是一款专为 Agent 应用打造的基础模型。延续一贯的开源原则,目前这款模型已经在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License。

来自主题: AI资讯
10586 点击    2025-07-29 09:07