AI资讯新闻榜单内容搜索-模型

大模型「记忆断片」成历史！AI初创全新Zep系统，知识图谱破解上下文诅咒

Zep，一个为大模型智能体提供长期记忆的插件，能将智能体的记忆组织成情节，从这些情节中提取实体及其关系，并将它们存储在知识图谱中，从而让用户以低代码的方式为智能力构建长期记忆。

来自主题: AI技术研报

10940 点击 2025-02-26 14:53

DeepSeek会说话了！只要2行代码，这家公司让任意大模型秒开口

在AI行业新诞生的「多模态交互」赛道上，声网发布的「对话式AI引擎」，让所有文本大模型秒变多模态，具备实时语音对话能力，补齐了大模型「失语」的短板。

来自主题: AI资讯

11086 点击 2025-02-26 14:46

3 个月 1700 万美金 ARR，Lovable 也融了 1500 万美金

目前的 AI 行业，除了大模型外，竞争最激烈的可能就是 AI 编程了。昨天的文章《用 AI 解决专利纠纷半年 ARR 增 20 倍，Anthropic 再融 35 亿美金》里我还调侃 AI 编程正在经历百编大战，没想到今天这个行业又来了一些新消息。

来自主题: AI资讯

9680 点击 2025-02-26 14:26

500万TPM+20msTPOT，火山引擎用「AI云原生」重构大模型部署范式

部署 DeepSeek 系列模型，尤其是推理模型 DeepSeek-R1，已经成为一股不可忽视的潮流。

来自主题: AI资讯

7931 点击 2025-02-26 14:22

阿里开源版Sora上线即屠榜，4070就能跑，免费商用

开源模型，还是得看杭州。

来自主题: AI资讯

6718 点击 2025-02-26 14:16

多模态大模型对齐新范式，10个评估维度全面提升，快手&中科院&南大打破瓶颈

尽管多模态大语言模型（MLLMs）取得了显著的进展，但现有的先进模型仍然缺乏与人类偏好的充分对齐。这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域（例如减少幻觉问题），是否与人类偏好对齐可以全面提升MLLM的各种能力仍是一个未知数。

来自主题: AI技术研报

11438 点击 2025-02-26 14:07

千帧长视频时代到来！MIT全新扩散算法让任意模型突破时长极限

进入到 2025 年，视频生成（尤其是基于扩散模型）领域还在不断地「推陈出新」，各种文生视频、图生视频模型展现出了酷炫的效果。其中，长视频生成一直是现有视频扩散的痛点。

来自主题: AI技术研报

8237 点击 2025-02-26 13:39

何恺明开辟分形图像生成新范式！计算效率提高4000倍，首次实现高分辨率逐像素生成

何恺明再次开宗立派！开辟了生成模型的全新范式——

来自主题: AI技术研报

4614 点击 2025-02-26 13:33

DeepSeek开源通用矩阵乘法库，300行代码加速V3、R1，R2被曝五月前问世

DeepSeek 的开源周已经进行到了第三天（前两天报道见文末「相关阅读」）。今天开源的项目名叫 DeepGEMM，是一款支持密集型和专家混合（MoE）GEMM 的 FP8 GEMM 库，为 V3/R1 的训练和推理提供了支持，在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。

来自主题: AI资讯

9244 点击 2025-02-26 10:58

一文详解：DeepSeek 第三天开源的 DeepGEMM

DeepSeek 开源周的第三天，带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型（MoE）计算，为 DeepSeek-V3/R1 的训练和推理提供强大支持，在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。

来自主题: AI技术研报

8620 点击 2025-02-26 10:46