过程比结果重要:一个不给标准答案的调参框架,让Agent自己把数据库性能榨出来
过程比结果重要:一个不给标准答案的调参框架,让Agent自己把数据库性能榨出来数据库自动调参,一直是大模型Agent的“看似完美、实则翻车”名场面。
搜索
数据库自动调参,一直是大模型Agent的“看似完美、实则翻车”名场面。
好你个微软,当起大模型“倒爷”来了?!
就在所有人还在为Claude Fable 5的突然消失而懵圈时,Sakana AI却高调宣布:我们的Fugu比肩Fable,还不怕出口管制。
就在刚刚,OpenAI 直接放出了满血版 GPT-5.5-Cyber。CyberGym 安全评测排行榜,GPT-5.5-Cyber 得分 85.6%,单模型最高分。Claude Mythos 5 第二,83.8%。Claude Opus 4.7 排末尾,73.1%。
今天,阿里巴巴发布了其最新一代视频生成模型HappyHorse 1.1(快乐小马1.1)。阿里称,相比HappyHorse 1.1,这代模型在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度有了一定提升。
最新开源的Unlimited OCR,总参数3B,实际激活仅500M——放在大模型时代几乎是个零头。但就是这个小到离谱的模型,在OmniDocBench v1.5上拿下93.23%的综合分,v1.6更是达到93.92%,直接刷新了端到端SOTA。
“每一代模型,我们都在押注一个非共识。”
文本生成图像的领域早已经是一片红海,看上去已经卷无可卷了。
扩散模型生成得越来越好,但也越来越慢。
今年的VivaTech大会上,阿里巴巴董事长蔡崇信在一次“炉边对话”中,系统性地阐述了阿里的长期AI远景,这是继5月末耶鲁大学峰会之后,蔡崇信再度公开复盘阿里。