AI资讯新闻榜单内容搜索-大模型

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果，然而，Transformer 中自注意力带来的二次复杂度使得大模型的推理成本和内存占用十分巨大，特别是在长序列的场景中。

来自主题: AI技术研报

7164 点击 2024-04-03 17:29

80M参数打平GPT-4！苹果发超强上下文理解模型，聪明版Siri马上就来

苹果公司发布了一款参数量仅为80M的最新模型——ReALM，能够将各种形式的上下文转换为文本进行理解，包括解析屏幕、多轮对话以及上下文引用，提升了Siri等智能助手的反应速度和智能程度。

来自主题: AI技术研报

7231 点击 2024-04-03 16:35

AI | MO数学竞赛启动，陶哲轩力荐！50题对3道，百万大奖抱回家

又一项针对AI模型的数学奥赛来了！只要在50道题中做出3道，就有可能把百万美元大奖抱回家。题目难度为人类的高中学术竞赛难度，包括基础算术、代数思维和几何推理。欢迎AI模型们踊跃报名。

来自主题: AI技术研报

8282 点击 2024-04-03 16:24

OpenAI竞对用256轮对话「灌醉」大模型，Claude被骗造出炸弹！

就在刚刚，Anthropic发现了大模型的惊人漏洞。经过256轮对话后，Claude 2逐渐被「灌醉」，开始疯狂越狱，帮人类造出炸弹！谁能想到，它的超长上下文，反而成了软肋。

来自主题: AI技术研报

10365 点击 2024-04-03 15:46

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

大模型厂商在上下文长度上卷的不可开交之际，一项最新研究泼来了一盆冷水——Claude背后厂商Anthropic发现，随着窗口长度的不断增加，大模型的“越狱”现象开始死灰复燃。无论是闭源的GPT-4和Claude 2，还是开源的Llama2和Mistral，都未能幸免。

来自主题: AI技术研报

9579 点击 2024-04-03 14:31

国内首个音乐版「ChatGPT」来了！Sora同款架构，唱作技巧全面发展，还剧透了全新MoE大模型

AI音乐大模型最近有多火，不用多介绍了吧？不过，海外版应用别的先不说，奇奇怪怪的中文AI发音就能把人难受死……好在卷应用嘛，国产大模型厂商没在怕的，这不，国产版音乐“ChatGPT”这就来了~

来自主题: AI资讯

10973 点击 2024-04-03 14:17

企业内部如何更好落地大模型？我们走访了 10+ 先行者

在微软推出 Copilot 后，工作场景中如何落地 LLM 很快成为业内关注的重点。钉钉、飞书等办公软件也快速在最新版本中集成 AI 功能。对于软件企业而言，在已有的软件上增加 AI 功能，并带来新产值，已经被 Notion、多邻国等产品所验证。除此之外，在企业生产场景中，集成 LLM 的能力，并为企业组织赋能，也成为人们关注 AI 落地的一个视角。

来自主题: AI资讯

8501 点击 2024-04-03 11:43

智能化最积极的海尔，对大模型不着急了

海尔的“智家”步子，可以再迈大一点。AI改变终端的时代，最早投入智能化的家电公司表现怎么样？

来自主题: AI资讯

9597 点击 2024-04-03 11:38

无问芯穹夏立雪：破解算力焦虑，我做了大模型算力领域的“淘宝”丨36氪专访

清华系大模型领域创业又下一城，不过这次是中间层，解决的是算力焦虑问题。

来自主题: AI资讯

10468 点击 2024-04-03 10:31

究竟该指望谁来拉近我们与AI的距离？

AI被所有人使用的时代，正越来越近。如果说AI大模型之前已经用ChatGPT多轮的技术进展、国内的百模大战、Sora在视频大模型领域的突破，以及其他一系列大模型初步的应用探索证明了全新的AI更强大；那么最近悄然吹起的、厂商纷纷将最日常使用的消费电子终端套上AI之名的占位之风，则进一步宣告了AI普惠时代的加速到来。

来自主题: AI技术研报

10665 点击 2024-04-03 10:02