AI资讯新闻榜单内容搜索-模型

当奖励成为漏洞：从对齐本质出发自动「越狱」大语言模型

本文第一作者为香港大学博士研究生谢知晖，主要研究兴趣为大模型对齐与强化学习。

来自主题: AI技术研报

7938 点击 2024-08-31 15:09

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。

来自主题: AI技术研报

9653 点击 2024-08-31 14:54

智算中心，建设热潮的尽头是产业运营

8月28日至30日，2024中国国际大数据产业博览会正在贵阳火热进行中。“产业链上下游的人都来了。”一位行业人士观察，与以往不同，这届数博会上，数据要素、智算基础设施建设，正在和智能化、大模型行业应用等一起成为被密集讨论的话题。

来自主题: AI资讯

4968 点击 2024-08-31 14:43

估值160亿的燧原启动上市，终于又有国产芯片公司要IPO了

大模型带动生成式AI爆发后，对算力的高需求让芯片巨头英伟达的订单量、收入、股价一路走高，而国内芯片厂商却一直处于蛰伏状态。

来自主题: AI资讯

6480 点击 2024-08-31 14:10

LLM的范式转移：RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

来自主题: AI资讯

9648 点击 2024-08-31 11:19