AI资讯新闻榜单内容搜索-Ava

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ava
直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

今天几乎所有主流视觉语言模型(VLM)—— 无论是 Qwen-VL、InternVL,还是 LLaVA 系列 —— 都遵循着同一套经典架构:先用预训练视觉编码器(如 CLIP、SigLIP)将图像压缩为特征,再通过投影层把这些特征送入大语言模型。

来自主题: AI技术研报
7540 点击    2026-06-24 16:06
多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读

多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读

多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读

由格灵深瞳灵感实验室主导研发的 LLaVA-OneVision-2.0,是一款面向下一代感知智能的视觉语言大模型。团队充分利用视频 Codec 流和自研 OneVision-Encoder,实现跨帧、跨事件的增量观测和连续证据流建模。本文将详细介绍模型架构、训练方法与能力验证,展示该技术在视频理解、空间推理和目标追踪等任务中的应用潜力。

来自主题: AI技术研报
6363 点击    2026-06-03 15:03
久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

就在今天,美团龙猫大模型团队突然开源了商用级数字人视频生成模型 LongCat-Video-Avatar 1.5。在权威评测中,它的用户偏好胜率全面超越 Kling Avatar 2.0、OmniHuman-1.5 和 HeyGen 这三个头部玩家,并且直接以 MIT 协议开放,连商用限制都懒得设。

来自主题: AI资讯
9779 点击    2026-05-22 21:38
Wirestock 融资 2300 万美元背后:AI 公司开始争夺“创作者数据”,多模态时代的数据战争正在形成

Wirestock 融资 2300 万美元背后:AI 公司开始争夺“创作者数据”,多模态时代的数据战争正在形成

Wirestock 融资 2300 万美元背后:AI 公司开始争夺“创作者数据”,多模态时代的数据战争正在形成

最近,创作者平台 Wirestock 宣布完成 2300 万美元 Series A 融资,由 Nava Ventures 领投,SBVP(Sheryl Sandberg 参与创立)、Formula VC 与 I2BF Ventures 参投,公司累计融资规模达到约 2600 万美元。

来自主题: AI资讯
7924 点击    2026-05-17 11:23
不止动起来:SentiAvatar重新定义3D数字人动作生成范式

不止动起来:SentiAvatar重新定义3D数字人动作生成范式

不止动起来:SentiAvatar重新定义3D数字人动作生成范式

当你和 3D 数字人对话时,有没有遇到过这种诡异时刻:它的嘴在动,但表情依旧僵硬;手在挥舞,但和说话内容完全脱节;更糟的是,那种外表像真人但动作不自然的违和感,让人瞬间陷入 “恐怖谷”。

来自主题: AI技术研报
6094 点击    2026-04-08 16:30
168小时AI狂写300万行代码造出浏览器!Cursor公开数百个智能体自主协作方案

168小时AI狂写300万行代码造出浏览器!Cursor公开数百个智能体自主协作方案

168小时AI狂写300万行代码造出浏览器!Cursor公开数百个智能体自主协作方案

AI写代码,这次玩大了。 Cursor创始人宣布一项疯狂实验的结果:让数百个AI智能体连续跑了整整一周,从零开始,硬生生造出了一个可用的Web浏览器。项目代号FastRender,产出超过300万行代码,核心是一个用Rust从头写的渲染引擎,甚至还自带一个定制的JavaScript虚拟机。

来自主题: AI资讯
9477 点击    2026-01-17 10:52
没错,马斯克的二次元「女友」被雷蛇装到外设里了

没错,马斯克的二次元「女友」被雷蛇装到外设里了

没错,马斯克的二次元「女友」被雷蛇装到外设里了

AI 助手以类似手办的形式出现在桌面上,这样的场景你想象过吗?近日,CES 2026 展上,在琳琅满目的 AI 为核心的技术与产品中,一个「装在罐子里」的二次元少女形象的「桌面 AI 伙伴」,成为其中最具话题性的展示之一。这是由游戏外设公司 Razer (雷蛇)推出的 Project Ava,官方定位是「与您形影不离的 AI 桌面伴侣」,

来自主题: AI资讯
9098 点击    2026-01-08 09:52
从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗?现在,它迎来了史诗级进化!

来自主题: AI技术研报
9659 点击    2025-12-24 15:32