AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如价值观、性格和社交智能?如何建立更全面、更可靠的 AI 评估体系?北京大学宋国杰教授团队最新综述论文(共 63 页,包含 500 篇引文),首次尝试系统性梳理答案。

来自主题: AI技术研报
10257 点击    2025-05-27 16:13
与Gemini Diffusion共振!首个扩散式「发散思维链」来了

与Gemini Diffusion共振!首个扩散式「发散思维链」来了

与Gemini Diffusion共振!首个扩散式「发散思维链」来了

近年来,思维链在大模型训练和推理中愈发重要。近日,西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。该方法将反向扩散过程中的每一步中间结果都看作大模型的一个「思考」步骤,然后利用基于结果的强化学习去优化整个生成轨迹,最大化模型最终答案的正确率。

来自主题: AI技术研报
8196 点击    2025-05-27 13:21
99%的人都理解错了,AI Agent ≠ Agentic AI,康奈尔大学发33页论文澄清关键区别。

99%的人都理解错了,AI Agent ≠ Agentic AI,康奈尔大学发33页论文澄清关键区别。

99%的人都理解错了,AI Agent ≠ Agentic AI,康奈尔大学发33页论文澄清关键区别。

TL;DR:如果您有一个AI产品,用户问您这是AI Agent还是Agentic AI?如果您回答不出来,或者认为这两个概念是一回事,那您可能需要重新审视自己的技术认知了。不过没关系,因为99%的人都不知道,现在您只需要看完这篇文章就可以了。

来自主题: AI技术研报
7886 点击    2025-05-27 12:40
这样更公平:用jina-reranker-m0为多模态文档打分重排

这样更公平:用jina-reranker-m0为多模态文档打分重排

这样更公平:用jina-reranker-m0为多模态文档打分重排

当你在搜索“中国队在多哈乒乓球锦标赛的成绩”时,一篇新闻报道的文本部分和你的查询的相关性是 0.7,配图的相关性 0.5;另一篇则是文本相关性为 0.6,图片也是 0.6。那么,哪一篇报道才是你真正想要的呢?

来自主题: AI技术研报
8890 点击    2025-05-27 09:57
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型巨无霸体量,让端侧部署望而却步?华为联手中科大提出CBQ新方案,仅用0.1%的训练数据实现7倍压缩率,保留99%精度。

来自主题: AI技术研报
9940 点击    2025-05-26 15:21
她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

2023年,业界还在卷Scaling Law,不断突破参数规模和数据规模时,微软亚洲研究院张丽团队就选择了另一条路径。

来自主题: AI技术研报
7151 点击    2025-05-26 14:35
前OpenAI高管新作力挺模型思考,哈佛却称AI越「想」越笨

前OpenAI高管新作力挺模型思考,哈佛却称AI越「想」越笨

前OpenAI高管新作力挺模型思考,哈佛却称AI越「想」越笨

AI是否真正在「思考」乃至产生意识,正成为科学和哲学交汇的核心议题。前OpenAI负责人翁荔认为,增加模型的「思考时间」有助突破复杂推理瓶颈;哈佛等机构则指出思维链可能导致「降智」;而生物学家Mallavarapu断言数字计算机永不可能拥有意识。

来自主题: AI技术研报
10201 点击    2025-05-26 10:43
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。

来自主题: AI技术研报
8860 点击    2025-05-26 09:59