AI资讯新闻榜单内容搜索-模型训练

图像领域再次与LLM一拍即合！idea撞车OpenAI强化微调，西湖大学发布图像链CoT

MAPLE实验室提出通过强化学习优化图像生成模型的去噪过程，使其能以更少的步骤生成高质量图像，在多个图像生成模型上实现了减少推理步骤，还能提高图像质量。

来自主题: AI技术研报

8012 点击 2024-12-17 09:54

Scaling Law不仅在放缓，而且不一定总是适用！尤其在文本分类任务中，扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。

来自主题: AI技术研报

7676 点击 2024-12-16 09:43

本文介绍了首个多模态大模型（MLLM）可解释性综述

来自主题: AI技术研报

8742 点击 2024-12-15 19:25

ACM SIGKDD（简称 KDD）始于 1989 年，是全球数据挖掘领域历史最悠久、规模最大的国际顶级学术会议。KDD 2025 将于 2025 年 8 月 3 日在加拿大多伦多举办。

来自主题: AI技术研报

8198 点击 2024-12-14 14:00

大语言模型（LLMs）通过更多的推理展现出了更强的能力和可靠性，从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报

6928 点击 2024-12-13 14:40

Transformer模型自2017年问世以来，已成为AI领域的核心技术，尤其在自然语言处理中占据主导地位。然而，关于其核心机制“注意力”的起源，学界存在争议，一些学者如Jürgen Schmidhuber主张自己更早提出了相关概念。

来自主题: AI技术研报

7999 点击 2024-12-13 14:24

最近，Apollo Research团队发布了一项令人深思的研究。这项研究揭示了一个惊人的发现：当前主流的前沿AI模型已经具备了基本的"策划"（Scheming）能力。

来自主题: AI技术研报

6702 点击 2024-12-13 13:42

Hyper-YOLO是一种新型目标检测方法，通过超图计算增强了特征之间的高阶关联，提升了检测性能，尤其在识别复杂场景下的中小目标时表现更出色。

来自主题: AI技术研报

8250 点击 2024-12-12 14:35

一般而言，LLM 被限制在语言空间（language space）内进行推理，并通过思维链（CoT）来表达推理过程，从而解决复杂的推理问题。

来自主题: AI技术研报

8288 点击 2024-12-12 10:19

在这篇论文中，我们专注于人类互动中的信任行为，这种行为通过依赖他人将自身利益置于风险之中，是人类互动中最关键的行为之一，在日常沟通到社会系统中都扮演着重要角色。

来自主题: AI技术研报

8747 点击 2024-12-12 10:11