AI技术研报-这里有最前沿的人工智能技术解读

MATRIX：社会模拟推动大模型价值自对齐，比GPT4更「体贴」

随着大语言模型（LLMs）在近年来取得显著进展，它们的能力日益增强，进而引发了一个关键的问题：如何确保他们与人类价值观对齐，从而避免潜在的社会负面影响？

来自主题: AI技术研报

10666 点击 2024-02-27 14:03

大模型Scaling Law同样适用于下游任务性能？斯坦福、谷歌最新研究揭秘

大模型的成功很大程度上要归因于 Scaling Law 的存在，这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系，为模型开发、资源分配和选择合适的训练数据提供了宝贵的指导。

来自主题: AI技术研报

3411 点击 2024-02-27 14:00

刚刚，谷歌发布基础世界模型：11B参数，能生成可交互虚拟世界

问世才两个星期，谷歌的世界模型也来了，能力看起来更强大：它生成的虚拟世界「自主可控」。

来自主题: AI技术研报

6303 点击 2024-02-26 18:34

国内公司有望做出Sora吗？这支清华系大模型团队给出了希望

2023 年年底，很多人都预测，未来一年将是视频生成快速发展的一年。但出人意料的是，农历春节刚过，OpenAI 就扔出了一个重磅炸弹 —— 能生成 1 分钟流畅、逼真视频的 Sora。

来自主题: AI技术研报

8228 点击 2024-02-26 18:30

Sora·创世纪·大统一模型

无数人类天才穷尽一生才合伙建立残缺的大统一理论（GUT）：它只统一了强相互作用、弱相互作用和电磁力，引力至今无法统一到模型之中。

来自主题: AI技术研报

9639 点击 2024-02-26 18:11

首席分析师揭秘爆火Groq，每小时要烧168美元！10倍H100拥有成本，老黄笑而不语

SemiAnalysis的行业专家对最近爆火的Groq推理系统进行了像素级的拆解，测算出其持有成本依然高达现有H100的10倍，看来要赶上老黄的步伐，初创公司还有很多要做。

来自主题: AI技术研报

5946 点击 2024-02-26 18:03

GPT-4、Gemini同时被曝重大缺陷，逻辑推理大翻车！DeepMind上交校友团队发现LLM严重降智

谷歌DeepMind最新研究发现，问题中前提条件的呈现顺序，对于大模型的推理性能有着决定性的影响，打乱顺序能让模型表现下降30%。

来自主题: AI技术研报

3932 点击 2024-02-26 17:56

提前300毫秒预测聚变中等离子体「撕裂」，普林斯顿团队AI控制器登上Nature

近日，普林斯顿大学和普林斯顿等离子体物理实验室研究核聚变能的科学家表示，他们已经找到了一种使用人工智能的方法，预测这些潜在不稳定性并实时阻止其发生。

来自主题: AI技术研报

7837 点击 2024-02-25 16:04

打入AI底层！NUS尤洋团队用扩散模型构建神经网络参数，LeCun点赞

扩散模型，迎来了一项重大新应用——像Sora生成视频一样，给神经网络生成参数，直接打入了AI的底层！

来自主题: AI技术研报

8592 点击 2024-02-25 16:00

谷歌AI视频再出王炸！全能通用视觉编码器VideoPrism，性能刷新30项SOTA

谷歌团队推出「通用视觉编码器」VideoPrism，在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练，性能刷新30项SOTA。

来自主题: AI技术研报

5061 点击 2024-02-25 15:39

GPT-4正接管人类数据专家！先验知识让LLM大胆预测，准确率堪比传统方式

终有一天，LLM可以成为人类数据专家，针对不同领域进行数据分析，大大解放AI研究员。

来自主题: AI技术研报

7419 点击 2024-02-24 15:07

可控核聚变新里程碑！AI成功预测等离子体撕裂登Nature，清洁能源「圣杯」更近一步

困扰可控核聚变的一项重大难题，被AI成功攻克了！普林斯顿团队通过训练神经网络，提前300毫秒就预测了核聚变中的等离子不稳定态，因而能够防止等离子体的逃逸。人类离无穷尽的清洁能源，又近了一步。

来自主题: AI技术研报

8450 点击 2024-02-24 14:59

国内高校打造类Sora模型VDT，通用视频扩散Transformer被ICLR 2024接收

2 月 16 日，OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构，和市面上大部分主流方法（由 2D Stable Diffusion 扩展）并不相同。

来自主题: AI技术研报

6622 点击 2024-02-24 14:54

补齐Transformer规划短板，田渊栋团队的Searchformer火了

最近几年，基于 Transformer 的架构在多种任务上都表现卓越，吸引了世界的瞩目。使用这类架构搭配大量数据，得到的大型语言模型（LLM）等模型可以很好地泛化用于真实世界用例。

来自主题: AI技术研报

8341 点击 2024-02-24 14:51

200万上下文窗口创飞Gemini 1.5！微软来砸谷歌场子了（doge）

谷歌刚刷新大模型上下文窗口长度记录，发布支持100万token的Gemini 1.5，微软就来砸场子了。

来自主题: AI技术研报

7511 点击 2024-02-24 11:58

YOLOv9来了：实时目标检测新SOTA，完胜各种轻量或大型模型！出自v7作者

距离YOLOv8发布仅1年的时间，v9诞生了！

来自主题: AI技术研报

6208 点击 2024-02-24 11:53

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！

来自主题: AI技术研报

8348 点击 2024-02-23 14:42

谷歌VideoPoet负责人蒋路跳槽TikTok！对标Sora，AI视频模型大战在即

谷歌Research Lead，负责VideoPoet项目的蒋路，即将加入TikTok，负责视频生成AI的开发。

来自主题: AI技术研报

8333 点击 2024-02-22 15:44

模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的 2023 年中，大型语言模型（LLM）在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展，似乎我们即将进入一个可喜的新阶段：在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。

来自主题: AI技术研报

6255 点击 2024-02-22 15:31

超越AF2？Iambic、英伟达、加州理工学院开发多尺度深度生成模型，进行状态特异性蛋白质-配体复合物结构预测

由蛋白质和小分子配体形成的结合复合物无处不在，对生命至关重要。虽然最近科学家在蛋白质结构预测方面取得了进展，但现有算法无法系统地预测结合配体结构及其对蛋白质折叠的调节作用。

来自主题: AI技术研报

5168 点击 2024-02-22 15:28

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。

来自主题: AI技术研报

10742 点击 2024-02-22 15:25

谷歌最强开源大模型亮相！Gemini技术下放，笔记本就能跑，可商用

谷歌大模型，开源了！一夜之间，Gemma系列正式上线，全面对外开放。

来自主题: AI技术研报

9928 点击 2024-02-22 15:14

单GPU就能压缩模型，性能不变参数少25%！微软提出模型稀疏化新方法

大语言模型之大，成本之高，让模型的稀疏化变得至关重要。

来自主题: AI技术研报

6352 点击 2024-02-21 16:51

芯片专家详解刷屏的Groq芯片：目前并不能替代英伟达

财报发布前两天，英伟达突然冒出来一个劲敌。一家名叫Groq的公司今天在AI圈内刷屏，杀招就一个：快。

来自主题: AI技术研报

7599 点击 2024-02-21 11:40

GPT-4可能也在用的推测解码是什么？一文综述前世今生和应用情况

推测解码（Speculative Decoding）是谷歌等机构在 2022 年发现的大模型推理加速方法。它可以在不损失生成效果前提下，获得 3 倍以上的加速比。GPT-4 泄密报告也提到 OpenAI 线上模型推理使用了它。

来自主题: AI技术研报

8177 点击 2024-02-20 17:22

为什么openai可以跑通所有AGI技术栈？

简单说一下我的见解，以公司和技术趋势而不是个人的角度做一些分析，并预测一些OpenAI下一步的进展。

来自主题: AI技术研报

10304 点击 2024-02-20 11:43

100万token，一次能分析1小时YouTube视频，「大世界模型」火了

我们接连被谷歌的多模态模型 Gemini 1.5 以及 OpenAI 的视频生成模型 Sora 所震撼到，前者可以处理的上下文窗口达百万级别，而后者生成的视频能够理解运动中的物理世界，被很多人称为「世界模型」。

来自主题: AI技术研报

7865 点击 2024-02-20 11:24

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

大模型内卷时代，也不断有人跳出来挑战Transformer的统治地位，RWKV最新发布的Eagle 7B模型登顶了多语言基准测试，同时成本降低了数十倍

来自主题: AI技术研报

6971 点击 2024-02-20 11:12

LeCun怒斥Sora不能理解物理世界！Meta首发AI视频「世界模型」V-JEPA

短短几天，「世界模型」雏形相继诞生，AGI真的离我们不远了？Sora之后，LeCun首发AI视频预测架构V-JEPA，能够以人类的理解方式看世界。

来自主题: AI技术研报

8674 点击 2024-02-18 15:24

让视觉语言模型搞空间推理，谷歌又整新活了

视觉语言模型虽然强大，但缺乏空间推理能力，最近 Google 的新论文说它的 SpatialVLM 可以做，看看他们是怎么做的。

来自主题: AI技术研报

9283 点击 2024-02-18 15:10