AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。

来自主题: AI资讯
9881 点击    2025-02-07 00:26
DeepSeek最强专业拆解来了,清交复教授超硬核解读

DeepSeek最强专业拆解来了,清交复教授超硬核解读

DeepSeek最强专业拆解来了,清交复教授超硬核解读

周日晚间,五位高校教授夜话DeepSeek,从模型方法、框架、系统、基础设施等角度,阐述DeepSeek的技术原理与未来方向,揭秘其优化方法如何提升算力能效,信息量很大。

来自主题: AI技术研报
7699 点击    2025-02-06 15:57
大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

本文作者为北京邮电大学网络空间安全学院硕士研究生倪睿康,指导老师为肖达副教授。主要研究方向包括自然语言处理、模型可解释性。该工作为倪睿康在彩云科技实习期间完成。联系邮箱:ni@bupt.edu.cn, xiaoda99@bupt.edu.cn

来自主题: AI技术研报
5729 点击    2025-02-06 15:30
LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

以 GPT-4o 为代表的实时交互多模态大模型(LMMs)引发了研究者对高效 LMM 的广泛关注。现有主流模型通过将视觉输入转化为大量视觉 tokens,并将其嵌入大语言模型(LLM)上下文来实现视觉信息理解。

来自主题: AI技术研报
4764 点击    2025-02-06 15:26
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

本周三,该公司全面发布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。

来自主题: AI资讯
10295 点击    2025-02-06 15:13
垃圾提问+垃圾解读=垃圾文章:用「幻觉长城」来黑DeepSeek,谁给你的胆子?

垃圾提问+垃圾解读=垃圾文章:用「幻觉长城」来黑DeepSeek,谁给你的胆子?

垃圾提问+垃圾解读=垃圾文章:用「幻觉长城」来黑DeepSeek,谁给你的胆子?

“垃圾进,垃圾出!”在中文互联网上,一场针对国产AI技术的恶意攻击正在悄然蔓延。某些自媒体以“污染中文互联网”为名,对DeepSeek等国产大语言模型发起了一场看似正义、实则荒谬的讨伐。他们将“幻觉”这一技术术语污名化,试图用莫须有的罪名抹黑国产AI的进步。

来自主题: AI技术研报
8621 点击    2025-02-06 12:28
过年返乡,我看到了县城AI的真实景象

过年返乡,我看到了县城AI的真实景象

过年返乡,我看到了县城AI的真实景象

由chatGPT引发的大模型热潮迈入第三年,不少年轻人在这两年返乡中渐渐发现,AI正成为县城「银发人群」的新搭子。

来自主题: AI资讯
7159 点击    2025-02-06 12:23
世界级AI科学家加入阿里,出任集团副总裁

世界级AI科学家加入阿里,出任集团副总裁

世界级AI科学家加入阿里,出任集团副总裁

记者从多方获悉,全球顶尖人工智能科学家许主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。

来自主题: AI资讯
9015 点击    2025-02-06 12:20
「绮算法」获Z基金投资,打造软硬件结合的AI宠物健康平台

「绮算法」获Z基金投资,打造软硬件结合的AI宠物健康平台

「绮算法」获Z基金投资,打造软硬件结合的AI宠物健康平台

宠物大模型健康公司重庆绮算法科技有限公司(以下简称“绮算法”) 作为智谱Z计划企业,近日获得千万元级战略投资,由Z基金独投,融得资金将主要用于产品研发和商业化落地。源合资本担任独家财务顾问,负责后续融资。

来自主题: AI资讯
8028 点击    2025-02-06 12:16
Deepseek的隐喻:GPU失其鹿,ASIC、SOC们共逐之

Deepseek的隐喻:GPU失其鹿,ASIC、SOC们共逐之

Deepseek的隐喻:GPU失其鹿,ASIC、SOC们共逐之

诚如我们在《Deepseek的意义、价值与影响》中所阐述的那样,开源模型Deepseek的率先冲线,标志着 “机器智能寒武纪时刻”的启动,产业即将因此进入应用创新大爆发周期。

来自主题: AI资讯
8764 点击    2025-02-06 12:08