AI资讯新闻榜单内容搜索-模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型

Meta「轻量级」KernelLLM颠覆GPU内核生成，8B参数碾压GPT-4o

Meta「轻量级」KernelLLM颠覆GPU内核生成，8B参数碾压GPT-4o

Meta「轻量级」KernelLLM颠覆GPU内核生成，8B参数碾压GPT-4o

Meta推出KernelLLM，这个基于Llama 3.1微调的8B模型，竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示，它的单次推理性能超越GPT-4o和DeepSeek V3，多次生成时得分飙升。

来自主题: AI技术研报

8063 点击 2025-05-27 18:00

Claude 4被诱导窃取个人隐私！GitHub官方MCP服务器安全漏洞曝光

Claude 4被诱导窃取个人隐私！GitHub官方MCP服务器安全漏洞曝光

Claude 4被诱导窃取个人隐私！GitHub官方MCP服务器安全漏洞曝光

被选为GitHub Copilot官方模型后，Claude 4直接被诱导出bug了！

来自主题: AI资讯

7878 点击 2025-05-27 17:38

One RL to See Them All？一个强化学习统一视觉-语言任务！

One RL to See Them All？一个强化学习统一视觉-语言任务！

One RL to See Them All？一个强化学习统一视觉-语言任务！

强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而，RL 在推理任务之外的应用，尤其是在目标检测和目标定位等感知密集型任务中的应用，仍有待深入探索。

来自主题: AI技术研报

10165 点击 2025-05-27 17:33

【万字长文】大模型开源开发全景与趋势解读

【万字长文】大模型开源开发全景与趋势解读

【万字长文】大模型开源开发全景与趋势解读

“当我们看到这些数据趋势的时候，一个词浮现在我的眼前——黑客松（Hackathon），AI 领域的项目，快速地出现、快速地停更，他们似乎在做一场真实市场里的黑客松，那么，什么领域涌现了最多项目，哪些方面是停更的重灾区，哪些项目幸存了，激烈竞争的项目们如今怎么样了，我们都尝试着在这份趋势报告里叙述一二。”

来自主题: AI资讯

6764 点击 2025-05-27 17:13

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题，登HuggingFace热榜

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题，登HuggingFace热榜

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题，登HuggingFace热榜

推理大模型开卷新方向，阿里开源长文本深度思考模型QwenLong-L1，登上HuggingFace今日热门论文第二。

来自主题: AI技术研报

8334 点击 2025-05-27 16:58

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

在大型推理模型（例如 OpenAI-o3）中，一个关键的发展趋势是让模型具备原生的智能体能力。具体来说，就是让模型能够调用外部工具（如网页浏览器）进行搜索，或编写/执行代码以操控图像，从而实现「图像中的思考」。

来自主题: AI技术研报

10996 点击 2025-05-27 16:53

扩散语言模型九倍推理加速！上海交大：KV Cache并非自回归模型的专属技巧

扩散语言模型九倍推理加速！上海交大：KV Cache并非自回归模型的专属技巧

扩散语言模型九倍推理加速！上海交大：KV Cache并非自回归模型的专属技巧

首个用于加速扩散式大语言模型（diffusion-based Large Language Models, 简称 dLLMs）推理过程的免训练方法。

来自主题: AI技术研报

11375 点击 2025-05-27 16:22

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

随着大语言模型（LLM）能力的快速迭代，传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征，例如价值观、性格和社交智能？如何建立更全面、更可靠的 AI 评估体系？北京大学宋国杰教授团队最新综述论文（共 63 页，包含 500 篇引文），首次尝试系统性梳理答案。

来自主题: AI技术研报

10330 点击 2025-05-27 16:13

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

作为首批入选印度“IndiaAI Mission”国家级项目、承担构建印度主权基础大模型任务的公司之一，Sarvam AI 近日发布了名为 Sarvam-M 的模型。这是一个基于 Mistral Small 构建的 240 亿参数、权重开放的混合语言模型。

来自主题: AI资讯

11627 点击 2025-05-27 14:44

红杉中国xbench全球首发，AI智能体真实战力揭榜！

红杉中国xbench全球首发，AI智能体真实战力揭榜！

红杉中国xbench全球首发，AI智能体真实战力揭榜！

刚刚，全新AI基准测试工具xbench诞生，通过双轨评估体系和长青评估机制，追踪模型能力与实际场景价值。

来自主题: AI技术研报

11861 点击 2025-05-27 14:04

上一页当前第428页,共1078页下一页