AI资讯新闻榜单内容搜索-ATI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ATI
真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

近日清华大学于IEEE TPAMI发表论文,探讨了真机强化学习的安全性保障问题,提出了一套「安全探索均衡」新型机制,揭示了安全探索的理论最大边界,并攻克了其收敛性证明难题。

来自主题: AI技术研报
6746 点击    2026-06-24 16:03
95后女创始人从美瞳杀到AI陪伴,ZuzuZoos查无此园完成数千万元Pre-A轮融资

95后女创始人从美瞳杀到AI陪伴,ZuzuZoos查无此园完成数千万元Pre-A轮融资

95后女创始人从美瞳杀到AI陪伴,ZuzuZoos查无此园完成数千万元Pre-A轮融资

近日,AI-Native科技潮玩品牌ZuzuZoos查无此园宣布完成数千万元Pre-A轮融资,由锦秋基金领投、上海复容投资跟投。这家成立于2025年的初创公司,定位于"AI陪伴机器人+AI潮玩"方向,试图将情感陪伴、AI交互与潮玩IP结合,打造一款会拥抱人的便携式AI伙伴。

来自主题: AI资讯
6604 点击    2026-06-23 10:23
卖马桶的 TOTO 杀疯了,成了 AI 芯片的幕后赢家

卖马桶的 TOTO 杀疯了,成了 AI 芯片的幕后赢家

卖马桶的 TOTO 杀疯了,成了 AI 芯片的幕后赢家

如果要评选这轮 AI 狂潮里最魔幻的受益者,TOTO 大概率能拿到一个提名。

来自主题: AI资讯
8935 点击    2026-06-22 15:17
沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学(深圳)的团队沿着这一思路提出 Drifting Preference Optimization(DrPO),把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中,奖励只负责对候选图像排序,不参与反向传播。具体而言,针对同一个文本提示词,当前模型生成一组候选图像。高分样本在特征空间中产生吸引,低分样本产生排斥,并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报
7642 点击    2026-06-21 10:33
ICML 2026 Oral | 为3D空间智能数据构建全自动数据飞轮,Holi-Spatial打造400万级空间多模态数据集

ICML 2026 Oral | 为3D空间智能数据构建全自动数据飞轮,Holi-Spatial打造400万级空间多模态数据集

ICML 2026 Oral | 为3D空间智能数据构建全自动数据飞轮,Holi-Spatial打造400万级空间多模态数据集

从原始视频出发,无需人工介入,自动生成 3D 重建、深度、2D mask、3D 框、实例描述、3D grounding 和空间问答。Holi-Spatial 试图把「空间智能」的数据生产,推进到自动化、可扩展的新阶段。

来自主题: AI技术研报
6531 点击    2026-06-19 10:16
135亿!Manus收购案重大转机,传腾讯出手

135亿!Manus收购案重大转机,传腾讯出手

135亿!Manus收购案重大转机,传腾讯出手

刚刚,外媒The Information援引两位知情人士报道,爆款通用Agent产品Manus的早期中国支持者,计划掏出20亿美元(约合人民币135亿元),向Meta回购该公司。

来自主题: AI资讯
9273 点击    2026-06-18 23:35
RAG新SOTA,还在5亿条数据上跑进秒级,只有它了

RAG新SOTA,还在5亿条数据上跑进秒级,只有它了

RAG新SOTA,还在5亿条数据上跑进秒级,只有它了

广州智跃深空人工智能科技有限公司 Zleap AI 提出的 SAG(SQL-Retrieval Augmented Generation) 出场了。其实,名字已经点题了——不是 Graph、Hippo,而是 SQL-Retrieval。它的核心想法是在离线阶段,SAG 先把原始文本先整理成「事项 + 实体」的数据库结构。等查询来了,再围绕当前问题,用 SQL 动态串出一张局部线索网。

来自主题: AI技术研报
8615 点击    2026-06-18 16:58
ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,LLM agents 正在被用于越来越复杂的 agentic applications:deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报
6061 点击    2026-06-17 14:05