AI资讯新闻榜单内容搜索-Ava

冷门新语言AI写不动？IEEE论文：从零到及格线，MoonBit给出完整训练路线

对于Python、Java、JavaScript这些语言，大模型通常能给出相当成熟的答案。

来自主题: AI技术研报

5737 点击 2026-07-01 15:03

直接从像素到单词：这个原生大模型统一单图、多图、视频和空间智能

今天几乎所有主流视觉语言模型（VLM）—— 无论是 Qwen-VL、InternVL，还是 LLaVA 系列 —— 都遵循着同一套经典架构：先用预训练视觉编码器（如 CLIP、SigLIP）将图像压缩为特征，再通过投影层把这些特征送入大语言模型。

来自主题: AI技术研报

7540 点击 2026-06-24 16:06

多模态模型终于不用「抽帧看世界」？LLaVA-OneVision-2.0全开源全帧率技术解读

由格灵深瞳灵感实验室主导研发的 LLaVA-OneVision-2.0，是一款面向下一代感知智能的视觉语言大模型。团队充分利用视频 Codec 流和自研 OneVision-Encoder，实现跨帧、跨事件的增量观测和连续证据流建模。本文将详细介绍模型架构、训练方法与能力验证，展示该技术在视频理解、空间推理和目标追踪等任务中的应用潜力。

来自主题: AI技术研报

6363 点击 2026-06-03 15:03

久不发声的美团AI，一开口就开源商用数字人——还把三个闭源大佬给超了

就在今天，美团龙猫大模型团队突然开源了商用级数字人视频生成模型 LongCat-Video-Avatar 1.5。在权威评测中，它的用户偏好胜率全面超越 Kling Avatar 2.0、OmniHuman-1.5 和 HeyGen 这三个头部玩家，并且直接以 MIT 协议开放，连商用限制都懒得设。

来自主题: AI资讯

9779 点击 2026-05-22 21:38

大神李沐回归B站「做了个实时数字人」，直言「水平吊打我自己」

时隔近一年，那个在 B 站教大家阅读 AI 论文的大神李沐 @跟李沐学 AI，终于回归了！

来自主题: AI资讯

9864 点击 2026-05-18 17:53

Wirestock 融资 2300 万美元背后：AI 公司开始争夺“创作者数据”，多模态时代的数据战争正在形成

最近，创作者平台 Wirestock 宣布完成 2300 万美元 Series A 融资，由 Nava Ventures 领投，SBVP（Sheryl Sandberg 参与创立）、Formula VC 与 I2BF Ventures 参投，公司累计融资规模达到约 2600 万美元。

来自主题: AI资讯

7924 点击 2026-05-17 11:23

不止动起来：SentiAvatar重新定义3D数字人动作生成范式

当你和 3D 数字人对话时，有没有遇到过这种诡异时刻：它的嘴在动，但表情依旧僵硬；手在挥舞，但和说话内容完全脱节；更糟的是，那种外表像真人但动作不自然的违和感，让人瞬间陷入 “恐怖谷”。

来自主题: AI技术研报

6094 点击 2026-04-08 16:30

168小时AI狂写300万行代码造出浏览器！Cursor公开数百个智能体自主协作方案

AI写代码，这次玩大了。 Cursor创始人宣布一项疯狂实验的结果：让数百个AI智能体连续跑了整整一周，从零开始，硬生生造出了一个可用的Web浏览器。项目代号FastRender，产出超过300万行代码，核心是一个用Rust从头写的渲染引擎，甚至还自带一个定制的JavaScript虚拟机。

来自主题: AI资讯

9477 点击 2026-01-17 10:52

没错，马斯克的二次元「女友」被雷蛇装到外设里了

AI 助手以类似手办的形式出现在桌面上，这样的场景你想象过吗？近日，CES 2026 展上，在琳琅满目的 AI 为核心的技术与产品中，一个「装在罐子里」的二次元少女形象的「桌面 AI 伙伴」，成为其中最具话题性的展示之一。这是由游戏外设公司 Razer （雷蛇）推出的 Project Ava，官方定位是「与您形影不离的 AI 桌面伴侣」，

来自主题: AI资讯

9098 点击 2026-01-08 09:52

从「会表演」到「更会演」：KlingAvatar2.0让数字人拥有生动灵魂

还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗？现在，它迎来了史诗级进化！

来自主题: AI技术研报

9659 点击 2025-12-24 15:32