强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!
强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!大模型的预训练-微调范式,正在悄然改写强化学习!伯克利团队提出新方法InFOM,不依赖奖励信号,也能在多个任务中实现超强迁移,还能做到「读心术」级别的推理。这到底怎么做到的?
搜索
大模型的预训练-微调范式,正在悄然改写强化学习!伯克利团队提出新方法InFOM,不依赖奖励信号,也能在多个任务中实现超强迁移,还能做到「读心术」级别的推理。这到底怎么做到的?
如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。然而,它们在长视频理解和检索等长上下文任务中仍表现不佳。
如今对于苹果来说,买下Perplexity或许是个不错的选择。“全世界都在搞AI,只有苹果还盯着UI”,这可能是不少人在看完今年WWDC开发者大会后的感受。当一众友商在AI赛道狂飙突进时,苹果的表现却非常克制,但这或许并不是他们不愿参与AI前沿的探索,而是有心无力。为了解决自研AI落后的问题,苹果方面可能会选择用“买买买”来解决。
Agent Infra是AI时代的新热点,涉及为Agent重建基础设施以适应其与人类的根本差异,包括交互方式、学习模式、责任界定等。核心是创建安全环境如E2B沙盒和Browserbase浏览器工具,支持Agent反馈循环和多任务协作,预计Browser Use市场将大幅增长,开发者需聚焦差异场景提升价值。
在经过深度思考后,我有了一个大胆的猜想:我们一直在用错误的框架理解它,大家都把它当作"更好的编程工具",但我越用越觉得,这根本不是一个编程工具,而是一个披着终端外衣的通用 AI agent。正好周末看了Anthropic 产品负责人 Michael Gerstenhaber 的最新一期访谈,
王兴此前透露过美团计划在 6 月份推出餐饮行业经营决策 AI 助手「袋鼠参谋」,就是期望解决我刚刚说的问题:商家开店的疑难杂症、一般 AI 回复质量不足。
据ZP独家获悉,首形科技正式宣布完成新一轮融资,由招商局创投、深创投共同领投,五源资本、浔商创投跟投。此前天使轮投资人为德迅投资、奇绩创坛、Taihill、智元机器人。不久前,由其创始人发布的一段“仿生机器人睁眼、缓缓微笑”的视频在社交平台爆红。
更有趣的是,当整个硅谷都在追逐白领市场的AI应用时,一家名为Netic的创业公司却把目光投向了那些最传统、最"不科技"的行业——水管工、电工、屋顶工和暖通空调技师。
一个显而易见的事实是,技术不是 AI 应用落地的最大困境,思维与视野才是。究其本质,「新瓶装旧酒」,是业界许多团队的困局——尽管采用了前沿工具与技术,却仍沿用传统软件开发的思维框架,这种路径依赖导致大量项目折戟沉沙。
你有没有想过,创业这件事可能彻底变了?不再是硅谷精英的专利,不再需要巨额资金和深厚技术背景,甚至不再需要风险投资的支持。AI 正在彻底重新定义创业的门槛和玩法。