TRM思考奖励模型上线,大模型推理质量终于能量化了 | ICML‘26 Oral
TRM思考奖励模型上线,大模型推理质量终于能量化了 | ICML‘26 Oral大模型推理能力越来越强,但答案对了,思考过程就一定好吗?
搜索
大模型推理能力越来越强,但答案对了,思考过程就一定好吗?
硬氪获悉,雪梦未来(SnowOrigin)团队获得龚虹嘉、陆奇及海外机构投资。这支北大背景团队以sEMG(表面肌电)运动神经信号解码技术为切入点,通过神经腕带、第一视角采集设备以及自研NMH(Neural Math Hybrid)AI解码模型,构建新一代面向具身智能的人类操控数据采集方案。
英伟达不造机器人,但要帮具身企业造好机器人(doge)
2020年,吴迪读研一,张启煊念大三,他们跟同为上海科技大学学生的张龙文、曾初啸一起创办了影眸科技。公司早期做过一系列有关3D与生成的探索——做过穹顶光场扫描,做过二次元APP,做过数字人,踩过元宇宙的尾巴,也经历过几乎没有现金流的至暗时刻。
今天上午,利弗莫尔证券数据确认:MOMENTA GLOBAL LIMITED(梦腾智驾环球有限公司)已正式通过港交所上市聆讯,联席保荐人为中金公司、德意志银行。
今天,华盛顿大学即将毕业的博士生 Alisa Liu 要加入 OpenAI 的消息上了 X 热搜。主贴浏览量已突破百万,她表示这次找工作的过程比想象中更有挑战,但也收获满满。所以她写了一篇小博客,分享一路走来学到的经验,也希望能让下一个经历这个过程的人少一点困惑。
在机器人、自动驾驶、AR等真实场景中,空间理解从来都不是“看一眼图像”就能解决的问题。
AI Agent 正在重塑软件开发。写代码、修 bug,它的能力肉眼可见地往上涨。但软件开发,从来不止 "写代码" 这一件事。装环境、配依赖、部署服务、编排容器、管理云资源、处理安全策略,这些 "让软件活起来" 的脏活累活,才是真实开发的大头。而它们,几乎都发生在同一个地方:终端。
Fable 5回来了?Claude安卓版的「模型选择器」中,消失一周的Fable 5意外现身。
AI画图巨头突然杀入医疗圈!60秒泡个澡就能完成全身扫描,0.5毫米精度碾压CT和MRI,4PFlops的算力怪兽,让医疗行业今夜无眠。最惊人的是,Midjourney的终极目标竟是延长人类寿命,消灭全球30%的死亡。