NeurIPS 2024 | 无需训练,一个框架搞定开放式目标检测、实例分割
NeurIPS 2024 | 无需训练,一个框架搞定开放式目标检测、实例分割本文介绍了来自北京大学王选计算机研究所的王勇涛团队的最新研究成果 VL-SAM。针对开放场景,该篇工作提出了一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM,在无需训练的情况下,取得了良好的开放式 (Open-ended) 目标检测和实例分割结果,论文已被 NeurIPS 2024 录用。
搜索
本文介绍了来自北京大学王选计算机研究所的王勇涛团队的最新研究成果 VL-SAM。针对开放场景,该篇工作提出了一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM,在无需训练的情况下,取得了良好的开放式 (Open-ended) 目标检测和实例分割结果,论文已被 NeurIPS 2024 录用。
生成式AI技术不断进步,但能打动玩家的仍是设计背后与人有关的部分。
近日,中科大王杰教授团队 (MIRA Lab) 针对离线强化学习数据集存在多类数据损坏这一复杂的实际问题,提出了一种鲁棒的变分贝叶斯推断方法,有效地提升了智能决策模型的鲁棒性,为机器人控制、自动驾驶等领域的鲁棒学习奠定了重要基础。论文发表在 CCF-A 类人工智能顶级会议 Neural Information Processing Systems(NeurIPS 2024)。
近两年来,AI儿童陪伴领域涌入了不少创业者,吸引众多目光,儿童陪伴也成为AI大模型落地的重要场景。
预测金融市场和股票价格变动需分析公司表现、历史价格、行业事件及人类因素(如社交媒体和新闻报道)。
大家好,今天我们要聊的是Relume.io。这个AI网站构建平台能够让你以前所未有的速度设计和搭建网站。
语音交互体验成为了 AI 落地的一块绊脚石。 而如今扣子推出的技术,有望使这种情况成为过去式。
鲨疯了!谷歌新版Gemini超越o1,强势登顶竞技场总榜第一! 在经6000+网友匿名投票后,不仅数学成绩和学霸o1相当,还拿下其它5个单项第一。
测评大模型Agent能力,从未如此直观。 新旧两版Claude 3.5 Sonnet在《我的世界》里PK盖楼,差距不要太明显,引来大量围观。
OpenAI发布了支持Windows和macOS的ChatGPT桌面端,这种更加集成化的形式为用户在各种生活与工作的场景下,带来了更好的无缝式交互体验。对于常在桌面端办公的开发者来讲,应用协作功能尤其引人注目并超乎期待。