AI资讯新闻榜单内容搜索-Lab

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

近日，字节跳动智能创作部门（Intelligent Creation Lab）提出新作 DreamLite，一个主干网络仅有 0.39B 参数的轻量级统一扩散模型，在单一网络内同时支持文生图（Text-to-Image）和图像编辑（Text-guided Image Editing）两个任务，是目前已知首个实现这一能力的端侧模型。

来自主题: AI技术研报

8973 点击 2026-05-13 10:30

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

随着大模型后训练（Post-training）技术的发展，强化学习（RL）在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报

9406 点击 2026-05-13 09:59

翁荔创业大模型首秀！告别“120亿美元估值0模型”

AI再也不是“回合制”了。Thinking Machines Lab（以下简称TML）发布首个模型，让实时交互能力成为模型原生能力。联合创始人翁荔出镜演示。

来自主题: AI资讯

9323 点击 2026-05-12 17:07

Thinking Machines Lab拿出了一个「最人性」的 AI —— 「交互模型」Interaction Model

Mira Murati 用一年半时间证明了「人机协作」不是一句口号。 5 月 11 日，Thinking Machines Lab 发布了一段研究预览视频，展示了他们所谓的「交互模型」（Interaction Model）。

来自主题: AI资讯

9275 点击 2026-05-12 10:13

Siggraph 26 | 视频版Vision-Banana来了？大一统框架UniVidX刷新多项视频任务SOTA

近日，由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报

10126 点击 2026-05-12 08:53

万帧照片级仿真，打通视觉机器人学习的感知与物理鸿沟：国产仿真器GS-Playground入选RSS 2026

近日，清华大学智能产业研究院（AIR）DISCOVER Lab 联合谋先飞技术、原力灵机、求之科技和地瓜机器人，提出了新一代高通量视觉高保真仿真器 GS-Playground。该成果已被机器人领域国际顶级学术会议 RSS 2026（Robotics: Science and Systems）录用，标志着国内具身智能仿真基础设施在视觉保真度与训练吞吐量两个维度上同时取得了国际领先水平的突破。

来自主题: AI技术研报

7783 点击 2026-05-08 14:06

AI音频独角兽ElevenLabs透露D轮股东信息，其ARR（年度经常性收入）已突破5亿美元

英国AI音频独角兽ElevenLabs披露了其D轮融资新的投资者，同时透露其ARR（年度经常性收入）已突破5亿美元（约合人民币34.1亿元）。奥斯卡影帝杰米·福克斯、演员伊娃·朗格利亚等30余位创意人士首次成为股东。

来自主题: AI资讯

9879 点击 2026-05-06 16:48

突破视觉仿真算力瓶颈！新一代具身智能仿真框架开源：高吞吐并行高保真渲染助力规模化训练

为了攻克这些制约具身智能领域发展的核心难题，清华大学智能产业研究院（AIR）DISCOVER Lab联合谋先飞技术、原力灵机、求之科技和地瓜机器人，提出了GS-Playground通用多模态仿真框架。

来自主题: AI技术研报

7898 点击 2026-05-03 22:41

最新！Karpathy：Vibe Coding只是抬高了地板，真正的战场在这里

Andrej Karpathy（OpenAI 联合创始人、前特斯拉 AI 负责人、现 Eureka Labs 创始人）在 AI Ascent 2026 上与红杉合伙人 Stephanie Zhan 对话，谈论自他提出 "vibe coding" 一年以来的变化。他解释了为什么作为程序员他从未感到如此落后，为什么 agentic engineering 是在 vibe coding 之上

来自主题: AI资讯

9957 点击 2026-04-30 12:13

ACL 2026｜Doc-V*：读100页文档不如只翻对5页，80页场景「暴打」RAG 10个点

Doc-V* 由小米大模型 Plus 团队和华中科技大学 VLRLab 团队合作提出，一种从「静态阅读」到「主动探索」的多页文档理解新范式，通过交互式视觉推理让模型像人一样有策略地阅读长文档。

来自主题: AI技术研报

8853 点击 2026-04-30 09:00