AI资讯新闻榜单内容搜索-模型

任少卿的智驾非共识：世界模型、长时序智能体与 “变态” 工程主义

任少卿的头发很有辨识度，浓密、微卷，刘海盖住额头。走进会议室，第一次见他的人把他当成了实习生，知道身份后调侃说，只有在 AI 创业公司才能看到这么年轻的技术 leader。

来自主题: AI资讯

10800 点击 2025-10-12 15:00

既然后训练这么重要，那么作为初学者，应该掌握哪些知识？大家不妨看看这篇博客《Post-training 101》，可以很好的入门 LLM 后训练相关知识。从对下一个 token 预测过渡到指令跟随；监督微调（SFT）基本原理，包括数据集构建与损失函数设计；

来自主题: AI技术研报

8658 点击 2025-10-12 14:59

风雨飘摇中的Meta，于昨天发布了一篇重量级论文，提出了一种被称作「早期经验」（Early Experience）的全新范式，让AI智能体「无师自通」，为突破强化学习瓶颈提供了一种新思路。

来自主题: AI技术研报

10128 点击 2025-10-12 11:01

当大语言模型生成海量数据时，数据存储的难题也随之而来。对此，华盛顿大学（UW）SyFI实验室的研究者们提出了一个创新的解决方案：LLMc，即利用大型语言模型自身进行无损文本压缩的引擎。

来自主题: AI技术研报

7284 点击 2025-10-12 11:00

传统DFT计算太慢？SurFF来了！这个基础模型通过晶面生成、快速弛豫和Wulff构型，精准评估晶面可合成性与暴露度。SurFF相较于DFT实现了10⁵倍的加速，多源实验与文献验证一致率达73.1%。

来自主题: AI技术研报

8206 点击 2025-10-12 10:43

AI公务员的大脑就是政务大模型。就在刚刚，中央网信办和国。就在刚刚，中央网信办和国家发展改革委联合印发了重磅文件——《政务领域人工智能大模型部署应用指引》（我们后面就叫它《指引》）。

来自主题: AI资讯

9940 点击 2025-10-12 10:06

游戏理解领域模型LynkSoul VLM v1，在游戏场景中表现显著超过了包括GPT-4o、Claude 4 Sonnet、Gemini 2.5 Flash等一众顶尖闭源模型。背后厂商逗逗AI，亦在现场吸引了不少关注的目光。

来自主题: AI资讯

10128 点击 2025-10-11 17:25

面壁智能近期已完成新一轮融资。本轮融资由北京市属国有投资平台“京国瑞”（北京京国瑞股权投资基金管理有限公司）及市场化创投基金“米聚和基”等共同参与，数亿元资金将主要用于加大端侧大模型研发力度及推动商业化进程。

来自主题: AI资讯

8851 点击 2025-10-11 17:19

开源编程模型王座，再度易主！来自快手的KAT-Dev-72B-Exp，在SWE-Bench认证榜单以74.6%的成绩夺得开源模型第一。KAT-Dev-72B-Exp是KAT-Coder模型的实验性强化学习版本。

来自主题: AI资讯

12440 点击 2025-10-11 15:57

10 月 9 日凌晨，蚂蚁百灵大模型团队奇袭般官宣了一款自家最新语言大模型 Ling-1T，参数量达到 1000B（即 1万亿参数）。然而，就在十天前，百灵团队才将自研 Ring-1T-preview 大模型开源。

来自主题: AI资讯

10517 点击 2025-10-11 15:55