AI资讯新闻榜单内容搜索-不

3700次预训练总结超参规律，开源海量实验，告别盲猜

近年来，大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而，要实现其高效部署，精细的超参数优化至关重要。为了探究最佳超参数的规律，我们开展了大规模的实证研究，通过在不同配置上进行网格搜索，我们揭示了一套通用的最优超参数缩放定律（Optimal Hyperparameter Scaling Law）。

来自主题: AI技术研报

10439 点击 2025-03-13 15:15

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

不怕推理模型简单问题过度思考了，能动态调整CoT的新推理范式SCoT来了！

来自主题: AI技术研报

8484 点击 2025-03-13 14:58

YOLOe问世，实时观察一切，统一开放物体检测和分割

它能像人眼一样，在文本、视觉输入和无提示范式等不同机制下进行检测和分割。

来自主题: AI技术研报

11074 点击 2025-03-13 14:46

长链推理表象下，大模型精细表征张冠李戴的本质

近些年，大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始，到 2022 年底的 GPT-3，再到现在国内外大模型的「百模争锋」，DeepSeek 异军突起，各类大模型应用层出不穷。

来自主题: AI技术研报

11623 点击 2025-03-13 14:41

Phase：让每个设计师都能轻松创建专业动画，提升产品体验

在当今数字产品设计领域，动画已不再是锦上添花，而是提升用户体验的关键要素。然而，对于大多数设计师来说，创建高质量的交互动画一直是一项挑战 —— 传统动画工具如 Adobe After Effects 或 Rive 不仅学习曲线陡峭，而且价格不菲。

来自主题: AI资讯

9001 点击 2025-03-13 11:47

全面对标ChatGPT，Meta也要做AI聊天机器人

Meta此举，或是要证明他们大规模投资AI基础设施不是在蛮干。

来自主题: AI资讯

8611 点击 2025-03-13 11:35

14B 小模型逆袭翻译赛道，论文财报实测超Claude，不信试试“我命由我不由天”

都说通用大模型轻松拿捏翻译，结果有人来掀桌了。

来自主题: AI技术研报

7586 点击 2025-03-13 11:30

AI视频渗透老年朋友圈：“一天起号，快速变现”

“发财了，一个视频回本，收益300多。”一位群友在群里发布了自己的视频号截图。另一位群友不语，只是发布了自己同话题的视频，显示收益800多。

来自主题: AI资讯

12152 点击 2025-03-13 10:47

多模态训练后模型能力雪崩，上海AI Lab全面探索MLLM偏好对齐与模态融合

在实际应用过程中，闭源模型（GPT-4o）等在回复的全面性、完备性、美观性等方面展示出了不俗的表现。

来自主题: AI技术研报

9125 点击 2025-03-13 10:15

曝两大巨头争投AI独角兽Anthropic，内幕：豪赌数百亿，进不去董事会

今天，外媒披露了谷歌在美国大模型独角兽Anthropic中的持股细节。相关文件显示，谷歌数年来累计对Anthropic注资30亿美元（约合人民币217亿元），换取了后者14%的股份。令人意外的是，这些投资并未让谷歌在Anthropic的运营中享有过多的话语权，但谷歌仍计划在今年9月以可转债的形式再追加7.5亿美元（约合人民币54亿元）投资。

来自主题: AI资讯

9905 点击 2025-03-12 20:20