AI资讯新闻榜单内容搜索-模型

Gemini准确率从21%飙到97%！谷歌只用了这一招：复制粘贴

简单到难以置信！近日，Google Research一项新研究发现：想让大模型在不启用推理设置时更准确，只需要把问题复制粘贴再说一遍，就能把准确率从21.33%提升到97.33%！

来自主题: AI技术研报

10291 点击 2026-01-18 14:58

解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估

香港大学（The University of Hong Kong）与 Adobe Research 联合发布 Self-E（Self-Evaluating Model）：一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接：让同一个模型在极少步数也能生成语义清晰、结构稳定的图像，同时在 50 步等常规设置下保持顶级质量，并且随着步数增加呈现单调提升。

来自主题: AI技术研报

9443 点击 2026-01-18 14:57

AI医疗，谷歌放大招！开源全球首个「AI全能医生」，告别算力焦虑，医院一键部署！

刚刚，AI医疗新突破，来自谷歌！这一次，他们直接瞄准了真实临床环境的痛点。为此，谷歌祭出了最新模型MedGemma 1.5，找到了破局答案。相较于此前的MedGemma 1.5，MedGemma 1.5在多模态应用上实现重大突破，融合了：

来自主题: AI资讯

10725 点击 2026-01-18 09:54

谷歌回应openai，发布在手机上可以使用的开源翻译模型TranslateGemma，

OpenAI悄悄发布了翻译产品ChatGPT Translate，谷歌则祭出强势回应——TranslateGemma，一个能在手机上翻55种语言的开源模型。

来自主题: AI资讯

10710 点击 2026-01-17 14:39

00后团队芸思智能（Vinsoo）拿下AI编程智能体榜SOTA效果世界第一，一人公司时代真的要来了

只靠模型性能，永远解决不了工程问题，真正的解法在云端Agent——这是芸思智能（Vinsoo）团队在研发之初就建立的认知。Vinsoo3.0中，Vinsoo云端Agent通过架构革命，实现了对传统工具的降维打击。

来自主题: AI资讯

10223 点击 2026-01-16 20:05

美团又上新模型，8个Thinker齐开工，能顶个诸葛亮？

美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型，拥有 5600 亿个参数，基于创新的 MoE 架构构建。该模型引入了强大的重思考模式（Heavy Thinking Mode），能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前重思考模式已在 LongCat AI 平台正式上线，人人均可体验。

来自主题: AI资讯

10480 点击 2026-01-16 14:35

吴恩达开新课教OCR！用Agent搞定文档提取

随着AI大模型研发在架构、记忆、存储等等领域的深水区创新，OCR重新成为了技术专项。DeepSeek在研究、智谱在研究、阿里千问和腾讯混元也都在研究……还得是吴恩达老师，火速来了新课程，帮你速通OCR。

来自主题: AI资讯

9359 点击 2026-01-16 14:33

PromptTuner：基于 HarmonyOS 6 的提示词助手应用技术实践分享

项目缘起：从 0 到 1 的 PromptTuner 诞生之路随着大模型技术的普及，AI 交互已成为日常工作的重要组成部分。然而，如何写出高质量的提示词（Prompt）却成为普通用户面临的新挑战。

来自主题: AI资讯

9629 点击 2026-01-16 14:26

开源框架让代码AI偷师GitHub！bug修复率飙升至69.8%，性能创纪录

MemGovern团队投稿量子位 | 公众号 QbitAI 人类程序员碰到棘手bug通常会上网查询前辈经验。当前AI虽然开始具备联网搜索能力，但仍不能很好地从网络经验中获取修复bug的能力。让

来自主题: AI资讯

8499 点击 2026-01-16 14:25

不止于量化：最新综述用「时-空-构」三维视角解构KV Cache系统级优化

近期，来自墨尔本大学和华中科技大学的研究者们发布了一篇深度综述，从 MLSys 的思维出发，用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化方法进行了系统性梳理与深入分析，并将相关资源整理成了持续维护的 Awesome 资源库，方便研究者与从业人员快速定位与落地。

来自主题: AI技术研报

6466 点击 2026-01-16 14:24