AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

MAPLE实验室提出通过强化学习优化图像生成模型的去噪过程,使其能以更少的步骤生成高质量图像,在多个图像生成模型上实现了减少推理步骤,还能提高图像质量。

来自主题: AI技术研报
8012 点击    2024-12-17 09:54
Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。

来自主题: AI技术研报
7676 点击    2024-12-16 09:43
KDD2025 | 多标签节点分类场景下,阿里安全&浙大对图神经网络增强发起挑战

KDD2025 | 多标签节点分类场景下,阿里安全&浙大对图神经网络增强发起挑战

KDD2025 | 多标签节点分类场景下,阿里安全&浙大对图神经网络增强发起挑战

ACM SIGKDD(简称 KDD)始于 1989 年,是全球数据挖掘领域历史最悠久、规模最大的国际顶级学术会议。KDD 2025 将于 2025 年 8 月 3 日在加拿大多伦多举办。

来自主题: AI技术研报
8198 点击    2024-12-14 14:00
多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

大语言模型(LLMs)通过更多的推理展现出了更强的能力和可靠性,从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报
6928 点击    2024-12-13 14:40
LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

Transformer模型自2017年问世以来,已成为AI领域的核心技术,尤其在自然语言处理中占据主导地位。然而,关于其核心机制“注意力”的起源,学界存在争议,一些学者如Jürgen Schmidhuber主张自己更早提出了相关概念。

来自主题: AI技术研报
7999 点击    2024-12-13 14:24
守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

最近,Apollo Research团队发布了一项令人深思的研究。这项研究揭示了一个惊人的发现:当前主流的前沿AI模型已经具备了基本的"策划"(Scheming)能力。

来自主题: AI技术研报
6702 点击    2024-12-13 13:42
超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联

超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联

超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联

Hyper-YOLO是一种新型目标检测方法,通过超图计算增强了特征之间的高阶关联,提升了检测性能,尤其在识别复杂场景下的中小目标时表现更出色。

来自主题: AI技术研报
8250 点击    2024-12-12 14:35
田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

一般而言,LLM 被限制在语言空间(language space)内进行推理,并通过思维链(CoT)来表达推理过程,从而解决复杂的推理问题。

来自主题: AI技术研报
8288 点击    2024-12-12 10:19
NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

在这篇论文中,我们专注于人类互动中的信任行为,这种行为通过依赖他人将自身利益置于风险之中,是人类互动中最关键的行为之一,在日常沟通到社会系统中都扮演着重要角色。

来自主题: AI技术研报
8747 点击    2024-12-12 10:11