AI技术研报-这里有最前沿的人工智能技术解读

卷积网络又行了？DeepMind推翻Transformer最强传说，LeCun怒赞

DeepMind最新研究发现，只要模型设计上没有缺陷，决定模型性能的核心可能是训练计算量和数据。在相同计算量下，卷积神经网络模型和视觉Transformers模型的性能居然能旗鼓相当！

来自主题: AI技术研报

7376 点击 2023-10-29 10:24

中国人工智能协会发布《2023年中国人工智能系列白皮书——深度学习》

获取原版PDF，请添加官方微信 openai178 免费领取。2023年中国人工智能学会发布了《中国人工智能系列白皮书—深度学习》，白皮书包含了从人工智能历史到深度学习的技术解析，以及AI在各领域的落地应用。报告原文PDF多达461页，24万字。

来自主题: AI技术研报

16152 点击 2023-10-28 22:59

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

GraphGPT框架将图结构模型和大语言模型进行参数对齐，利用双阶段图指令微调范式提高模型对图结构的理解能力和适应性，再整合ChatGPT提高逐步推理能力，实现了更快的推理速度和更高的图任务预测准确率。

来自主题: AI技术研报

4297 点击 2023-10-28 21:18

智谱AI与清华大学联合发布第三代基座大语言模型ChatGLM3：代码、数学推理、AI Agent能力大幅增强，依然免费商用授权！

今天，智谱AI开源其第三代基座大语言模型ChatGLM3-6B，官方说明该模型的性能较前一代大幅提升，是10B以下最强基础大模型！

来自主题: AI技术研报

10623 点击 2023-10-27 19:03

类人智能体孤独时会社交、愤怒时会跑步，是否应该让AI更像人？

在一项研究中，当类人智能体非常饥饿时，它们会在正餐之外吃点小吃；当感到愤怒时，会去跑步来释放愤怒；当感到伤心时，会寻求信任的朋友的支持；当感到厌恶时，会练习深呼吸和冥想技巧。

来自主题: AI技术研报

2005 点击 2023-10-27 09:50

吃“有毒”数据，大模型反而更听话了！来自港科大&华为诺亚方舟实验室

相比于一味规避“有毒”数据，以毒攻毒，干脆给大模型喂点错误文本，再让模型剖析、反思出错的原因，反而能够让模型真正理解“错在哪儿了”，进而避免胡说八道。

来自主题: AI技术研报

4827 点击 2023-10-26 20:25

“举一反三”的学习能力，AI也要追上人类了？

研究创造了一个神经网络，该人工智能（AI）系统在将新学到的单词添加到现有的词汇表中并在新的上下文中使用它们的能力，超越了ChatGPT，表现与人类相当，而这一能力正是人类认知能力的关键——系统泛化。

来自主题: AI技术研报

5097 点击 2023-10-26 14:05

AI绘画干货|用chatGPT+midjourney做2024年龙年海报的视觉设计

2024年元旦将至，很多公司都有做龙年主题海报的需求。我们今天抛砖引玉，给大家介绍用chatGPT和midjourney做龙年主题海报的详细步骤。

来自主题: AI技术研报

10958 点击 2023-10-25 20:04

QQ音乐与元象XVERSE合作推出 lyraXVERSE 加速大模型，助力AI小琴

今天最新消息，元象XVERSE与腾讯音乐合作推出 lyraXVERSE 加速大模型，将应用于音乐助手 “AI 小琴” 中。用户可以通过点击 QQ 音乐上的 “AI 一起听” 按键来与升级版的 “AI 小琴” 互动，她将根据用户的提问、播放习惯和心情提供闲聊、推歌、音乐解读和词曲创作等服务。

来自主题: AI技术研报

7962 点击 2023-10-25 09:36

谷歌开源一种AI的微调方法：逐步提炼，让小模型也能媲美2000倍体量大模型

大型语言模型能力惊人，但在部署过程中往往由于规模而消耗巨大的成本。华盛顿大学联合谷歌云计算人工智能研究院、谷歌研究院针对该问题进行了进一步解决，提出了逐步微调（Distilling Step-by-Step）的方法帮助模型训练。

来自主题: AI技术研报

5295 点击 2023-10-24 23:46

爆火AutoGPT获1200万美元融资，GitHub已有151k星

今年爆火的智能体项目AutoGPT，现获得了1200万美元融资。不得不说，Auto-GPT在AI领域掀起了巨大的波澜，它就像是赋予了GPT-4记忆和实体一样，让它能够独立应对任务，甚至从经验中学习，不断提高自己的性能。

来自主题: AI技术研报

8556 点击 2023-10-24 20:32

如果AI有了意识，我们该如何得知？

本文介绍了一份AI意识检查清单，用于评估AI系统是否具备意识。研究人员根据意识理论提取了6种意识指标，并通过评估Transformer和Perceiver等AI系统，展示了使用这些指标的方法。

来自主题: AI技术研报

7159 点击 2023-10-24 14:54

解决大模型复现难、协作难，这支95后学生团队打造了一个国产AI开源社区

无论是科研工作者还是从业者，都希望能在知识和技术的共享基础上，实现更加高效、有深度的协作，推动 AI 领域的进一步发展。在这样的背景下，一个全新的 AI 开源社区平台「SwanHub」诞生了。

来自主题: AI技术研报

16816 点击 2023-10-23 13:58

AgentLM：对齐Agent能力的大模型来了！7B/13B/70B全开源

智谱AI&清华KEG提出了一种对齐 Agent 能力的微调方法 AgentTuning，该方法使用少量数据微调已有模型，显著激发了模型的 Agent能力，同时可以保持模型原有的通用能力。

来自主题: AI技术研报

4948 点击 2023-10-23 10:17

LeptonAI 使用体验

阿里巴巴算法工程师手把手教你部署AI模型

来自主题: AI技术研报

4915 点击 2023-10-22 21:47

GPT-4不知道自己错了！ LLM新缺陷曝光，自我纠正成功率仅1%，LeCun马库斯惊呼越改越错

GPT-4根本不知道自己犯错？最新研究发现，LLM在推理任务中，自我纠正后根本无法挽救性能变差，引AI大佬LeCun马库斯围观。

来自主题: AI技术研报

4133 点击 2023-10-22 17:36

INC42发布36页研报：解读印度超过 170 亿美元的生成人工智能市场

Inc42 题为《2023 年印度生成式 AI 初创公司格局》的最新报告，该国的 GenAI 市场将在未来几年呈指数级增长。预计到 2030 年，这一数字将从 2023 年的 11 亿美元突破 170 亿美元，复合年增长率为 48%。

来自主题: AI技术研报

10798 点击 2023-10-22 12:50

用GPT-4训练机器人，英伟达最新Agent开源：任务越复杂越拿手

英伟达最新AI AgentEureka ，用GPT-4生成奖励函数，结果教会机器人完成了三十多个复杂任务。

来自主题: AI技术研报

7973 点击 2023-10-22 10:46

从「最强2D」升维「最强3D」！智源联合清北重磅发布10亿参数Uni3D视觉大模型

最近，智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D，在主流3D视觉能力上取得了全方位的性能突出！

来自主题: AI技术研报

5610 点击 2023-10-21 14:12

AI读脑成真，延迟仅0.25秒，Meta里程碑新研究：MEG实时解码大脑图像，LeCun转赞

Meta AI研发新成果，利用脑电信号将人类大脑活动解码并可视化。这项研究开辟了一条前所未有的新途径，能够帮助科学界了解图像如何在大脑中表示，进一步揭示人类智能的其他方面。

来自主题: AI技术研报

6315 点击 2023-10-20 10:13

用AI整理维基百科的引用文献，提高准确性

神经网络可以识别出哪些引用是不支持文章观点的，并且搜索出更好的来源作为引用。这是一个对于AI写论文领域的重要发现。

来自主题: AI技术研报

5697 点击 2023-10-20 09:01

Transformer一作来卷多模态！学术图表也能看懂，100毫秒极速响应｜免费试玩

最近多模态大模型是真热闹啊。这不，Transformer一作携团队也带来了新作，一个规模为80亿参数的多模态大模型Fuyu-8B

来自主题: AI技术研报

5549 点击 2023-10-19 22:09

斯坦福大学公布 "基础模型透明度指数”，LLaMA 2排名第一，GPT-4排在第三

斯坦福大学的研究人员公布了一套 "基础模型透明度指数"评分系统，目的是让大家对AI模型有更深的了解

来自主题: AI技术研报

9041 点击 2023-10-18 23:10

PyTorch官方认可！斯坦福博士新作：长上下文LLM推理速度提8倍

这两天，FlashAttention团队推出了新作：一种给Transformer架构大模型推理加速的新方法，最高可提速8倍。该方法尤其造福于长上下文LLM，在64k长度的CodeLlama-34B上通过了验证

来自主题: AI技术研报

5241 点击 2023-10-18 14:43

大模型无法替代码农！普林斯顿芝大惊人发现：GPT-4解决GitHub编程问题成功率为0

ChatGPT之类的AI编码工具来势汹汹，Stack Overflow又裁员了！不过，普林斯顿和芝大竟发现，面对真实世界GitHub问题，GPT-4的解决率竟是0%。

来自主题: AI技术研报

8376 点击 2023-10-17 15:14

Zilliz X Dify.AI，快速打造知识库AI应用

Zilliz和 Dify.AI 达成合作，Zilliz 旗下的产品 Zilliz Cloud、Milvus 与开源 LLMOps 平台 Dify 社区版进行了深度集成。

来自主题: AI技术研报

11031 点击 2023-10-17 14:13

全面超越AutoGPT，面壁智能联合清华NLP实验室开源大模型「超级英雄」XAgent

国内领先的人工智能大模型公司面壁智能又放大招，联合清华大学 NLP 实验室共同研发并推出大模型「超级英雄」——XAgent。

来自主题: AI技术研报

8899 点击 2023-10-17 13:45

英伟达爆火智能体研究：AI逼真还原人类情感！会饿会孤独，会跑步会发火

英伟达、华盛顿大学等机构提出的Humanoid Agents，行为竟如此接近人类！累了要休息，孤独要找人陪，发泄怒火时会跑步或冥想。

来自主题: AI技术研报

7486 点击 2023-10-16 15:56

我们用笔记本CPU跑了生成式AI，让它写代码、作图...

早就听说笔记本PC就能跑生成式AI，我们也试了试，看看笔记本仅借助CPU能不能在本地自己写代码、自己作图？

来自主题: AI技术研报

12266 点击 2023-10-16 10:37

千亿美元AI Agent赛道，如何重构知识工作？

Agent 的思路为我们带来了 Software 2.0 的图景：LLM 作为推理引擎能力不断增强，AI Agent 框架为其提供结构化思考的方法，软件生产进入“3D 打印”时代

来自主题: AI技术研报

7790 点击 2023-10-15 20:28

AI技术研报-这里有最前沿的人工智能技术解读

卷积网络又行了？DeepMind推翻Transformer最强传说，LeCun怒赞

中国人工智能协会发布《2023年中国人工智能系列白皮书——深度学习》

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

智谱AI与清华大学联合发布第三代基座大语言模型ChatGLM3：代码、数学推理、AI Agent能力大幅增强，依然免费商用授权！

类人智能体孤独时会社交、愤怒时会跑步，是否应该让AI更像人？

吃“有毒”数据，大模型反而更听话了！来自港科大&华为诺亚方舟实验室

“举一反三”的学习能力，AI也要追上人类了？

AI绘画干货|用chatGPT+midjourney做2024年龙年海报的视觉设计

QQ音乐与元象XVERSE合作推出 lyraXVERSE 加速大模型，助力AI小琴

谷歌开源一种AI的微调方法：逐步提炼，让小模型也能媲美2000倍体量大模型

爆火AutoGPT获1200万美元融资，GitHub已有151k星

如果AI有了意识，我们该如何得知？

解决大模型复现难、协作难， 这支95后学生团队打造了一个国产AI开源社区

AgentLM：对齐Agent能力的大模型来了！7B/13B/70B全开源

LeptonAI 使用体验

GPT-4不知道自己错了！ LLM新缺陷曝光，自我纠正成功率仅1%，LeCun马库斯惊呼越改越错

INC42发布36页研报：解读印度超过 170 亿美元的生成人工智能市场

用GPT-4训练机器人，英伟达最新Agent开源：任务越复杂越拿手

从「最强2D」升维「最强3D」！智源联合清北重磅发布10亿参数Uni3D视觉大模型

AI读脑成真，延迟仅0.25秒，Meta里程碑新研究：MEG实时解码大脑图像，LeCun转赞

用AI整理维基百科的引用文献，提高准确性

Transformer一作来卷多模态！学术图表也能看懂，100毫秒极速响应｜免费试玩

斯坦福大学公布 "基础模型透明度指数”，LLaMA 2排名第一，GPT-4排在第三

PyTorch官方认可！斯坦福博士新作：长上下文LLM推理速度提8倍

大模型无法替代码农！普林斯顿芝大惊人发现：GPT-4解决GitHub编程问题成功率为0

Zilliz X Dify.AI，快速打造知识库AI应用

全面超越AutoGPT，面壁智能联合清华NLP实验室开源大模型「超级英雄」XAgent

英伟达爆火智能体研究：AI逼真还原人类情感！会饿会孤独，会跑步会发火

我们用笔记本CPU跑了生成式AI，让它写代码、作图...

千亿美元AI Agent赛道，如何重构知识工作？

解决大模型复现难、协作难，这支95后学生团队打造了一个国产AI开源社区