AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

本文综合北京大学王选计算机研究所发布的 ProactiveVideoQA 和 MMDuet2 两篇论文,介绍视频多模态大模型如何实现 “主动交互”—— 在视频播放过程中自主决定何时发起回复,而非等待用户提问。ProactiveVideoQA 提出评估指标和 benchmark,MMDuet2 则通过强化学习训练方法实现了 SOTA 性能,无需精确的回复时间标注即可训练出及时、准确的主动交互模型。

来自主题: AI技术研报
8245 点击    2026-03-30 15:02
2026 年  Agent 最重要的工程概念:「Harness Engineering」

2026 年 Agent 最重要的工程概念:「Harness Engineering」

2026 年 Agent 最重要的工程概念:「Harness Engineering」

最近,AI 圈子里又冒出一个新词:Harness Engineering。

来自主题: AI技术研报
9165 点击    2026-03-30 15:01
ICRA 2026 | NUS邵林团队提出Goal-VLA:生成式大模型化身「世界模型」,实现零样本机器人操作

ICRA 2026 | NUS邵林团队提出Goal-VLA:生成式大模型化身「世界模型」,实现零样本机器人操作

ICRA 2026 | NUS邵林团队提出Goal-VLA:生成式大模型化身「世界模型」,实现零样本机器人操作

在具身智能领域,机器人操作的泛化能力一直是一个核心挑战。当前,视觉 - 语言 - 动作(VLA)模型主要分为两大范式:端到端模型与分层模型。端到端 VLA 模型(如 RT-2 [1], OpenVLA [2])严重依赖海量的 “指令 - 视觉 - 动作” 成对数据,获取成本极高,导致其在面对新任务或新场景时零样本泛化能力受限。

来自主题: AI技术研报
5741 点击    2026-03-30 15:00
务工家庭走出00后天才!AI初创公司Axiom宣布完成2亿美元A轮融资

务工家庭走出00后天才!AI初创公司Axiom宣布完成2亿美元A轮融资

务工家庭走出00后天才!AI初创公司Axiom宣布完成2亿美元A轮融资

2亿美元A轮融资,估值110亿,成立仅一年就成为独角兽。更震撼的是创始人——25岁的广州00后洪乐潼,父母是从未上过大学的普通务工者。她用数学解决AI最大的痛点:让模型推理步步可验证,彻底杜绝幻觉。为了加入她,弗吉尼亚大学终身教授直接辞职。

来自主题: AI资讯
6300 点击    2026-03-30 10:36
Karpathy紧急叫停!别再喂数据了,曝AGI方向全错

Karpathy紧急叫停!别再喂数据了,曝AGI方向全错

Karpathy紧急叫停!别再喂数据了,曝AGI方向全错

Karpathy给一支平均年龄25岁的「叛军」站台,红杉和GV连眼都不眨就拍出1.8亿美金。这群人放话:要么把效率干得比人脑高10倍,要么看着AI把地球烧干!

来自主题: AI资讯
6031 点击    2026-03-30 09:57
硅谷大佬抢着投!给奶牛戴AI项圈:估值20亿美元

硅谷大佬抢着投!给奶牛戴AI项圈:估值20亿美元

硅谷大佬抢着投!给奶牛戴AI项圈:估值20亿美元

这家新西兰的公司给奶牛戴上AI项圈,估值一年飙升20亿美元!Founders Fund领投,投资人抢到超额认购。它的秘密武器叫「Cowgorithm」——一套让牛自己放自己的算法。

来自主题: AI资讯
9914 点击    2026-03-30 09:56
DeepSeek 崩溃超12小时,工程师连夜抢修,现已恢复正常

DeepSeek 崩溃超12小时,工程师连夜抢修,现已恢复正常

DeepSeek 崩溃超12小时,工程师连夜抢修,现已恢复正常

从3月29日晚21时左右起,国内大模型产品DeepSeek的网页端与APP端服务器持续处于崩溃状态,大量用户反馈无法正常访问对话服务。

来自主题: AI资讯
7753 点击    2026-03-30 09:41
0基础AI手搓的同人乙游,2天‘玩家’暴涨60%

0基础AI手搓的同人乙游,2天‘玩家’暴涨60%

0基础AI手搓的同人乙游,2天‘玩家’暴涨60%

“‘AI一定会改变世界’和‘AI泡沫一定会破’是两件事”

来自主题: AI资讯
8866 点击    2026-03-30 09:30
CVPR 2026 | BiMotion:用 B 样条曲线重新定义 3D 角色运动生成

CVPR 2026 | BiMotion:用 B 样条曲线重新定义 3D 角色运动生成

CVPR 2026 | BiMotion:用 B 样条曲线重新定义 3D 角色运动生成

当你希望 AI 将 "士兵举起手臂,向后倾身,然后身体向前扑倒" 这段文字转化为一段 3D 角色动画,现有大多数方法给出的答案是:一段摇摇晃晃、语义残缺的短片段。这并非模型能力不足,问题的根源在于将运动表达为逐帧离散序列这一根本性的设计决策。

来自主题: AI技术研报
6935 点击    2026-03-30 09:28
手机就能指挥AI干活:谷歌Smith Agent叫板OpenClaw的5个杀招

手机就能指挥AI干活:谷歌Smith Agent叫板OpenClaw的5个杀招

手机就能指挥AI干活:谷歌Smith Agent叫板OpenClaw的5个杀招

你正在地铁上,突然想起有个API文档还没写完。以前你只能忍着到公司再弄,现在——你掏出手机,给AI发了一条指令,20分钟后代码自动跑完了。 这不是科幻,是Google员工已经用上的真东西。 它的名字叫

来自主题: AI资讯
8666 点击    2026-03-30 09:18