AI资讯新闻榜单内容搜索-模型训练

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报

8405 点击 2025-11-21 09:16

永别了，Tokenizer！何恺明师徒新作，颠覆AI生图技术

扩散模型「去噪」，是不是反而忘了真正去噪？何恺明携弟子出手，回归本源！

来自主题: AI技术研报

10484 点击 2025-11-20 15:26

AI Agent 工程化，本质是数据库系统设计

最近半年，我阅读了业界关于 AI Agent 的工程实践：Anthropic 的 Context Engineering 论文、Manus 的工程分享、Cline 的 Memory Bank 设计等。同时自己也一直在做跟 AI Agent 相关的项目，如：Jta[1]（开源的翻译 Agent，基于 Agentic Workflow）。

来自主题: AI技术研报

9035 点击 2025-11-20 15:03

大模型：从 .txt 到 .exe

下面这个，来自《人类的认知协议》的最后一个章节，写于一年前

来自主题: AI资讯

10674 点击 2025-11-20 10:04

何恺明团队新作：扩散模型可能被用错了

何恺明又一次返璞归真。

来自主题: AI技术研报

6865 点击 2025-11-20 09:35

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

在视觉处理任务中，Vision Transformers（ViTs）已发展成为主流架构。然而，近期研究表明，ViT 模型的密集特征中会出现部分与局部语义不一致的伪影（artifact），进而削弱模型在精细定位类任务中的性能表现。因此，如何在不耗费大量计算资源的前提下，保留 ViT 模型预训练核心信息并消除密集特征中的伪影？

来自主题: AI技术研报

8195 点击 2025-11-20 09:33