AI资讯新闻榜单内容搜索-ATI

真机强化学习如何保证安全性？清华团队提出安全探索均衡机制

近日清华大学于IEEE TPAMI发表论文，探讨了真机强化学习的安全性保障问题，提出了一套「安全探索均衡」新型机制，揭示了安全探索的理论最大边界，并攻克了其收敛性证明难题。

来自主题: AI技术研报

6746 点击 2026-06-24 16:03

95后女创始人从美瞳杀到AI陪伴，ZuzuZoos查无此园完成数千万元Pre-A轮融资

近日，AI-Native科技潮玩品牌ZuzuZoos查无此园宣布完成数千万元Pre-A轮融资，由锦秋基金领投、上海复容投资跟投。这家成立于2025年的初创公司，定位于"AI陪伴机器人+AI潮玩"方向，试图将情感陪伴、AI交互与潮玩IP结合，打造一款会拥抱人的便携式AI伙伴。

来自主题: AI资讯

6604 点击 2026-06-23 10:23

卖马桶的 TOTO 杀疯了，成了 AI 芯片的幕后赢家

如果要评选这轮 AI 狂潮里最魔幻的受益者，TOTO 大概率能拿到一个提名。

来自主题: AI资讯

8935 点击 2026-06-22 15:17

入选ECCV 2026！清华开源空间模型打败Gemini：真正的空间智能是在世界变化中持续学习

在机器人、自动驾驶、AR等真实场景中，空间理解从来都不是“看一眼图像”就能解决的问题。

来自主题: AI技术研报

6153 点击 2026-06-22 15:16

深度丨"缅因猫"背后的AI-Native研发实验：10人00后团队，2个月交付22B流式音视频模型

2026年的AI视频生成赛道，已经拥挤到连空气都变得稀薄。

来自主题: AI资讯

6449 点击 2026-06-22 09:39

沿着何恺明团队「漂移模型」再走一步：奖励只需排名，单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学（深圳）的团队沿着这一思路提出 Drifting Preference Optimization（DrPO），把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中，奖励只负责对候选图像排序，不参与反向传播。具体而言，针对同一个文本提示词，当前模型生成一组候选图像。高分样本在特征空间中产生吸引，低分样本产生排斥，并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报

7642 点击 2026-06-21 10:33

ICML 2026 Oral | 为3D空间智能数据构建全自动数据飞轮，Holi-Spatial打造400万级空间多模态数据集

从原始视频出发，无需人工介入，自动生成 3D 重建、深度、2D mask、3D 框、实例描述、3D grounding 和空间问答。Holi-Spatial 试图把「空间智能」的数据生产，推进到自动化、可扩展的新阶段。

来自主题: AI技术研报

6531 点击 2026-06-19 10:16

135亿！Manus收购案重大转机，传腾讯出手

刚刚，外媒The Information援引两位知情人士报道，爆款通用Agent产品Manus的早期中国支持者，计划掏出20亿美元（约合人民币135亿元），向Meta回购该公司。

来自主题: AI资讯

9273 点击 2026-06-18 23:35

RAG新SOTA，还在5亿条数据上跑进秒级，只有它了

广州智跃深空人工智能科技有限公司 Zleap AI 提出的 SAG（SQL-Retrieval Augmented Generation）出场了。其实，名字已经点题了——不是 Graph、Hippo，而是 SQL-Retrieval。它的核心想法是在离线阶段，SAG 先把原始文本先整理成「事项 + 实体」的数据库结构。等查询来了，再围绕当前问题，用 SQL 动态串出一张局部线索网。

来自主题: AI技术研报

8615 点击 2026-06-18 16:58

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」，LLM agents 正在被用于越来越复杂的 agentic applications：deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报

6061 点击 2026-06-17 14:05