AI资讯新闻榜单内容搜索-学习智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 学习智能体
ICML 2026|传统UED瓶颈被打破,强化学习也能精准定位「最近发展区」

ICML 2026|传统UED瓶颈被打破,强化学习也能精准定位「最近发展区」

ICML 2026|传统UED瓶颈被打破,强化学习也能精准定位「最近发展区」

训练强化学习智能体时,一个常见问题是:有些 level 太简单,智能体跑几遍就会;有些 level 又太难,智能体几乎得不到有效反馈。前者只是在重复已有能力,后者则会把训练预算消耗在无效探索上。真正有价值的训练环境,往往位于二者之间。

来自主题: AI技术研报
8507 点击    2026-05-22 08:45
专访丨华人本科生打造学习 Agent,获真格 100 万美元投资

专访丨华人本科生打造学习 Agent,获真格 100 万美元投资

专访丨华人本科生打造学习 Agent,获真格 100 万美元投资

这是一款由在校生团队打造的通用学习智能体:可以深度解题、拆开讲清抽象概念,又能从上百页课件、文献里提炼出 cheatsheet、闪卡和练习题,还会记住每个用户的学习方式,像一个长期陪伴在身边的私人老师。

来自主题: AI资讯
11015 点击    2025-11-20 10:55
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K

扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K

扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K

DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中,DIAMOND的平均得分超越了人类玩家,证明了其在模拟复杂环境中处理细节和进行决策的能力。

来自主题: AI技术研报
7042 点击    2024-11-18 15:24
三「模」联盟,谷歌DeepMind缔造终身学习智能体!

三「模」联盟,谷歌DeepMind缔造终身学习智能体!

三「模」联盟,谷歌DeepMind缔造终身学习智能体!

打造终身学习智能体,是研究界以来一直追求的目标。最近,帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体(DAAG),利用LLM+VLM+DM三大模型,让AI完成迁移学习、高效探索。

来自主题: AI资讯
4376 点击    2024-08-07 19:06
世界模型也扩散!训练出的智能体竟然不错

世界模型也扩散!训练出的智能体竟然不错

世界模型也扩散!训练出的智能体竟然不错

在图像生成领域占据主导地位的扩散模型,开始挑战强化学习智能体。

来自主题: AI技术研报
11064 点击    2024-05-24 11:22