AI资讯新闻榜单内容搜索-模型

小扎自曝砸重金训Llama 4，24万块GPU齐发力！预计2025年发布

Llama 3.1刚发布不久，Llama 4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama 3的十倍计算量，训练下一代多模态Llama 4，预计在2025年发布。

来自主题: AI技术研报

8239 点击 2024-08-05 15:25

11项指标击败GPT-4o！360攒局让16家大模型联手作战，组成最强“六边形战士”

终于，国产大模型能在综合能力上也能与GPT-4o一决雌雄了。

来自主题: AI资讯

10779 点击 2024-08-05 14:25

ResNet作者张祥雨，投身AI大模型

大模型的人才黑洞效应，还在持续。

来自主题: AI资讯

11249 点击 2024-08-05 14:16

LLM可解释性的未来希望？稀疏自编码器是如何工作的，这里有一份直观说明

简而言之：矩阵 → ReLU 激活 → 矩阵

来自主题: AI技术研报

11124 点击 2024-08-05 14:11

一文看尽LLM对齐技术：RLHF、RLAIF、PPO、DPO……

为了对齐 LLM，各路研究者妙招连连。

来自主题: AI技术研报

12342 点击 2024-08-05 14:09

70倍极致压缩！大模型的检查点再多也不怕

大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」，吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大，系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里，系统会崩溃 466 次，平均 2.78 小时一次！

来自主题: AI技术研报

9996 点击 2024-08-05 14:04

延迟交互模型，为什么是下一代RAG的标配？

在 RAG 系统开发中，良好的 Reranker 模型处于必不可少的环节，也总是被拿来放到各类评测当中，这是因为以向量搜索为代表的查询，会面临命中率低的问题，因此需要高级的 Reranker 模型来补救，这样就构成了以向量搜索为粗筛，以 Reranker 模型作精排的两阶段排序架构。

来自主题: AI技术研报

11164 点击 2024-08-05 13:58

OpenAI突然公布SearchGPT，谷歌搜索大敌已至

靴子终于落地，OpenAI的AI搜索还是来了。7月26日，就在推出小模型GPT-4o mini的一周后，OpenAI方面公布了备受外界关注的搜索产品SearchGPT。尽管目前SearchGPT仅向10000名测试用户开放，但OpenAI CTO Mira Murati在社交平台已经透露，最终目标是将搜索功能直接整合到ChatGPT中。

来自主题: AI技术研报

8763 点击 2024-08-05 12:26

Meta的Llama 3是合成数据训练？数据荒了解一下

如今一场席卷人工智能圈的“石油危机”已经出现，几乎每一家AI厂商都在竭力寻求新的语料来源，但再多的数据似乎也填不满AI大模型的胃口。更何况越来越多的内容平台意识到了手中数据的价值，纷纷开始敝帚自珍。为此，“合成数据”也成为了整个AI行业探索的新方向。

来自主题: AI资讯

8598 点击 2024-08-05 12:23

最强开源文生图模型一夜易主，SD原班人马打造，要发SOTA视频生成模型

最强开源文生图模型一夜易主！智东西8月2日报道，昨日晚间，开源文生图模型霸主Stable Diffusion原班人马，宣布推出全新的图像生成模型FLUX.1。

来自主题: AI技术研报

8088 点击 2024-08-05 12:06