AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报
8405 点击    2025-11-21 09:16
永别了,Tokenizer!何恺明师徒新作,颠覆AI生图技术

永别了,Tokenizer!何恺明师徒新作,颠覆AI生图技术

永别了,Tokenizer!何恺明师徒新作,颠覆AI生图技术

扩散模型「去噪」,是不是反而忘了真正去噪?何恺明携弟子出手,回归本源!

来自主题: AI技术研报
10484 点击    2025-11-20 15:26
AI Agent 工程化,本质是数据库系统设计

AI Agent 工程化,本质是数据库系统设计

AI Agent 工程化,本质是数据库系统设计

最近半年,我阅读了业界关于 AI Agent 的工程实践:Anthropic 的 Context Engineering 论文、Manus 的工程分享、Cline 的 Memory Bank 设计等。同时自己也一直在做跟 AI Agent 相关的项目,如:Jta[1](开源的翻译 Agent,基于 Agentic Workflow)。

来自主题: AI技术研报
9035 点击    2025-11-20 15:03
大模型:从 .txt 到 .exe

大模型:从 .txt 到 .exe

大模型:从 .txt 到 .exe

下面这个,来自《人类的认知协议》的最后一个章节,写于一年前

来自主题: AI资讯
10674 点击    2025-11-20 10:04
NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

在视觉处理任务中,Vision Transformers(ViTs)已发展成为主流架构。然而,近期研究表明,ViT 模型的密集特征中会出现部分与局部语义不一致的伪影(artifact),进而削弱模型在精细定位类任务中的性能表现。因此,如何在不耗费大量计算资源的前提下,保留 ViT 模型预训练核心信息并消除密集特征中的伪影?

来自主题: AI技术研报
8195 点击    2025-11-20 09:33
何恺明重磅新作:Just image Transformers让去噪模型回归基本功

何恺明重磅新作:Just image Transformers让去噪模型回归基本功

何恺明重磅新作:Just image Transformers让去噪模型回归基本功

大家都知道,图像生成和去噪扩散模型是密不可分的。高质量的图像生成都通过扩散模型实现。

来自主题: AI技术研报
7400 点击    2025-11-19 16:42
登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」

登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」

登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」

在过去两年,大语言模型 (LLM) + 外部工具的能力,已成为推动 AI 从 “会说” 走向 “会做” 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执行等场景中,大模型要想精准调用工具,不仅要求模型本身具备推理能力,还需要借助海量高质量、针对性强的函数调用训练数据。

来自主题: AI技术研报
11277 点击    2025-11-19 16:40