AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

如今,多模态大模型(MLLM)已经在视觉理解领域取得了长足进步,其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势,其有效性表明大语言模型(LLM)拥有了大量固有的视觉知识,使得它们能够在指令调整过程中有效地学习和发展视觉理解。

来自主题: AI技术研报
8946 点击    2024-12-21 11:12
如何看待字节的AI战略:全方位布局、全面平推

如何看待字节的AI战略:全方位布局、全面平推

如何看待字节的AI战略:全方位布局、全面平推

字节前几天的发布会,上线了一堆新的模型:视觉理解、3D 生成,以及全线降价

来自主题: AI资讯
8377 点击    2024-12-21 11:04
OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题

OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题

OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题

OpenAI下一代模型——o3,重磅诞生了!陶哲轩预言难住AI好几年的数学测试,它瞬间破解,编程水平位于全球前200,在ARC-AGI基准中更是惊人,打破所有AI纪录接近人类水平,离AGI更近一步。

来自主题: AI资讯
10838 点击    2024-12-21 10:01
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。

来自主题: AI资讯
9447 点击    2024-12-20 16:14
推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。

来自主题: AI资讯
9401 点击    2024-12-20 16:07
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
8616 点击    2024-12-20 15:59
UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

本文中,香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中,通过将不同类别和数量的输入/输出图像建模为视频帧,从大规模真实视频数据中学习属性、姿态、光照等多种变化规律,从而实现高保真的生成效果。

来自主题: AI技术研报
9157 点击    2024-12-20 15:40