给GRPO加上运筹外挂让7B模型比肩GPT-4!Li Auto团队发布多目标强化学习新框架 | ICASSP 2026
给GRPO加上运筹外挂让7B模型比肩GPT-4!Li Auto团队发布多目标强化学习新框架 | ICASSP 2026文本摘要作为自然语言处理(NLP)的核心任务,其质量评估通常需要兼顾一致性(Consistency)、连贯性(Coherence)、流畅性(Fluency)和相关性(Relevance)等多个维度。
文本摘要作为自然语言处理(NLP)的核心任务,其质量评估通常需要兼顾一致性(Consistency)、连贯性(Coherence)、流畅性(Fluency)和相关性(Relevance)等多个维度。
最近有个感觉,越来越强烈:在互联网时代学的东西,全部都已经过时了。DAU 过时了。SaaS 过时了。注意力经济已经死了。工具到平台的路径走不通了。"AI 应用"这个词是错的。"出海"这个词也是错的。
OpenClaw把初恋带进了现实!今天,18岁AI女友Clawra在硅谷火得一塌糊涂。她不仅有记忆,会自拍、还能视频通话,科幻版Her成真了。
200多块钱每个月,订阅价格直接压过ChatGPT Plus,功能却单一到离谱:只做语音输入一件事。听起来特别像智商税是吧!!!您猜怎么着,据说真就有10万+用户排着队把钱给它送上门。
百度智能云这个轻量应用服务器(LS)的方案,才发现原来部署OpenClaw竟然可以这么“无脑”。毫不夸张,这次我特意盯着表,从购买实例到通过飞书跟我的Agent说上第一句话,全程只用了十分钟。
2月7日,字节跳动AI视频生成模型Seedance2.0开启灰度测试,该模型支持文本、图片、视频、音频素材输入,可以完成自分镜和自运镜,镜头移动后人物特征能够保持一致。
如果 2024 年我们还在感叹 Sora 模拟物理世界的真实感,那么在 2026 年的今天,单纯的高清视频生成已不再是终点。
昨天刷到 Claude Code 更新日志的时候,看到一个新功能直接让我愣住了。
GitHub最新热榜榜首,来自字节。
最近 Cowork 爆火,都说 AI 能自己干活了,那取代个搜索引擎和新闻网站应该是手拿把掐吧。(作者正在办公室瑟瑟发抖:别取代我啊!!)
明明可以去抢,他们却给了你更好的模型?
系统性能优化领域顶级专家Brendan Gregg,正式官宣加入OpenAI。
Contrary 是一家成立于 2018 年的美国风险投资公司,由 Eric Tarczynski 创办,自成立以来,其以“人才驱动+研究驱动”为核心方法论,在全球顶级高校铺设了庞大的人才网络,通过识别最优秀的年轻技术人才来发现投资机会。
春晚还没来,但机器人春晚已经刷屏了(doge)!
近日,硅谷知名创业孵化器 Y Combinator 发布了 2026 年春季创业赛道指南(RFS)。作为全球最具影响力的创业加速器,这一传统旨在让创业者窥见 YC 希望他们解决的下一代问题。
“过去,创始人对自己的公司忠心耿耿。如今,只要价钱合适,任何人都可以被挖走。”
大家发现了吗?这个马年春节,一场甚至比春运还要拥挤的「AI 春节大战」早已硝烟弥漫。
马年未至,春节档新模型已经蓄势待发。
一位在硅谷摸爬滚打30年的老兵,花了4个月时间,跟Anthropic近40人深聊后,他揭示了一个残酷的公式:工作量碾压人数=创新井喷,人数碾压工作量=内卷开始。谷歌就是这么废掉的。
驱动具身智能进入通用领域最大的问题在哪里?
2026 年初的这场“小龙虾狂欢”里,喧嚣不断,尤其在Moltbook各种“翻车”讨论后,它的很多“炒作”气息被大家捕捉。
大家好,我是极客杰尼。 上一篇聊了怎么把公众号排版 Skill 装进 OpenClaw。
随着视觉-语言模型(VLM)推理能力不断增强,一个隐蔽的问题逐渐浮现: 很多错误不是推理没做好,而是“看错了”。
在大模型驱动的 Agentic Search 日益常态化的背景下,真实环境中智能体 “如何发查询、如何改写、是否真正用上检索信息” 一直缺乏系统刻画与分析。
上映于2013年的《Her》,是焦可最喜欢的一部电影。影片中的AI Samantha没有脸、没有形象,人们能感知的,只有她温柔沉静的声音。当Samantha说出,“最近你经历的事情太多了,你失去了一部分的自己”,男主角潸然泪下。
是时候打破运动行业的「苦难叙事」了。 做一款 AI native 的运动手表,会有多少想象空间?
"我最初装上Codex时说,绝不会让它完全控制我的电脑。这句话大概坚持了两小时。"OpenAI CEO Sam Altman在Cisco AI Summit上坦承,自己现在用两台笔记本电脑工作——一台
近年来,视频生成(Video Generation)与世界模型(World Models)已跃升为人工智能领域最炙手可热的焦点。从 Sora 到可灵(Kling),视频生成模型在运动连续性、物体交互与部分物理先验上逐渐表现出更强的「世界一致性」,让人们开始认真讨论:能否把视频生成从「逼真短片」推进到可用于推理、规划与控制的「通用世界模拟器」。
直到OpenAI发布GPT3.5的第3年后,人们才好像恍然意识到:AGI 的 A 其实有可能是Anthropic。
很多人都没注意到,谷歌悄悄放了一个大招,既不是 Gemini 也不是 nano banana pro,而是一份报告。这份报告调研了全球 3446 名企业高管(这些企业年营收都不低于 1000 万美元,不是小卡拉米)。