AI资讯新闻榜单内容搜索-上下文

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 上下文

“不发模型、不上新功能”的OpenAI DevDay，开发者们还能期待啥

“不发模型、不上新功能”的OpenAI DevDay，开发者们还能期待啥

“不发模型、不上新功能”的OpenAI DevDay，开发者们还能期待啥

去年，OpenAI在旧金山举办了一场引发业界轰动的开发者大会（DevDay 2023），推出了一系列新产品和工具，包括支持128K上下文的GPT-4 Turbo，API价格下调，新的Assistants API，具备视觉功能的GPT-4 Turbo，DALL·E 3 API，以及大幅改进的JSON模型，还有命运多舛的GPTs和类App Store平台GPT Store。

来自主题: AI资讯

7575 点击 2024-10-01 14:04

长上下文能取代RAG吗？

长上下文能取代RAG吗？

长上下文能取代RAG吗？

曾几何时，LLM还是憨憨的。脑子里的知识比较混乱，同时上下文窗口长度也有限。检索增强生成（RAG）的出现在很大程度上提升了模型的性能。

来自主题: AI资讯

5347 点击 2024-09-30 15:28

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

9741 点击 2024-09-21 18:19

你以为的LLM上下文学习超能力，究竟来自哪里，ICL的内部机制如何 |最新发布

你以为的LLM上下文学习超能力，究竟来自哪里，ICL的内部机制如何 |最新发布

你以为的LLM上下文学习超能力，究竟来自哪里，ICL的内部机制如何 |最新发布

上下文学习(In-Context Learning， ICL)是指LLMs能够仅通过提示中给出的少量样例，就迅速掌握并执行新任务的能力。这种“超能力”让LLMs表现得像是一个"万能学习者"，能够在各种场景下快速适应并产生高质量输出。然而，关于ICL的内部机制，学界一直存在争议。

来自主题: AI资讯

6313 点击 2024-09-11 10:17

原生集成GitHub，让AI成为协作者，Claude企业版馋哭个人开发者

原生集成GitHub，让AI成为协作者，Claude企业版馋哭个人开发者

原生集成GitHub，让AI成为协作者，Claude企业版馋哭个人开发者

Anthropic推出Claude企业版，集成GitHub和500K上下文长度。

来自主题: AI资讯

4970 点击 2024-09-06 10:35

AI编程赛道融资井喷独角兽涌现的背后：一个基于10%的人口都是“程序员”的冰雹猜想

AI编程赛道融资井喷独角兽涌现的背后：一个基于10%的人口都是“程序员”的冰雹猜想

AI编程赛道融资井喷独角兽涌现的背后：一个基于10%的人口都是“程序员”的冰雹猜想

AI编程初创公司Magic发布1亿上下文窗口模型，编码能力超级加倍

来自主题: AI资讯

10306 点击 2024-09-06 10:06

MemLong: 长文本的新记忆大师，可将上下文长度从4k提升到80k！

MemLong: 长文本的新记忆大师，可将上下文长度从4k提升到80k！

MemLong: 长文本的新记忆大师，可将上下文长度从4k提升到80k！

这篇文章介绍了一个名为MemLong的模型，它通过使用外部检索器来增强长文本建模的能力。

来自主题: AI技术研报

8741 点击 2024-09-05 16:33

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。

来自主题: AI技术研报

9815 点击 2024-08-31 14:54

Jamba 1.5发布，最长上下文，非Transformer架构首次成功领先

Jamba 1.5发布，最长上下文，非Transformer架构首次成功领先

Jamba 1.5发布，最长上下文，非Transformer架构首次成功领先

Jamba是第一个基于 Mamba 架构的生产级模型。Mamba 是由卡内基梅隆大学和普林斯顿大学的研究人员提出的新架构，被视为 Transformer 架构的有力挑战者。

来自主题: AI资讯

9884 点击 2024-08-24 10:07

微软连发3款Phi-3.5模型：128K上下文，首用MoE架构，部分性能超GPT-4o mini

微软连发3款Phi-3.5模型：128K上下文，首用MoE架构，部分性能超GPT-4o mini

微软连发3款Phi-3.5模型：128K上下文，首用MoE架构，部分性能超GPT-4o mini

轻量级模型的春天要来了吗？

来自主题: AI资讯

9121 点击 2024-08-22 09:29

上一页当前第34页,共43页下一页