AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

推理黑马出世,仅以5%参数量撼动AI圈。360、北大团队研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,32B参数,能够匹敌DeepSeek-R1-671B巨兽。

来自主题: AI资讯
7096 点击    2025-02-25 16:33
中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!

中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!

中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!

当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。”Anthropic 官方表示。

来自主题: AI技术研报
7190 点击    2025-02-25 15:09
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini,11秒便发现了内核代码有bug!

来自主题: AI技术研报
11431 点击    2025-02-25 14:59
LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。

来自主题: AI技术研报
9464 点击    2025-02-25 14:48
LLM自学成才变身「预言家」!预测未来能力大幅提升

LLM自学成才变身「预言家」!预测未来能力大幅提升

LLM自学成才变身「预言家」!预测未来能力大幅提升

还在惊叹预言家的神奇?如今LLM也掌握了预测未来的「超能力」!研究人员通过自我博弈和直接偏好优化,让LLM摆脱人工数据依赖,大幅提升预测能力。

来自主题: AI技术研报
8881 点击    2025-02-25 14:32
阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写

阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写

阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写

阿里通义Qwen团队熬夜通宵,推理模型Max旗舰版来了!QwQ-Max-Preview预览版,已在LiveCodeBench编程测试中排名第5,小超o1中档推理和DeepSeek-R1-Preview预览版。

来自主题: AI资讯
9840 点击    2025-02-25 11:52
一文详解:DeepSeek 第二天开源的 DeepEP

一文详解:DeepSeek 第二天开源的 DeepEP

一文详解:DeepSeek 第二天开源的 DeepEP

DeepSeek 本周正在连续 5 天发布开源项目,今天是第 2 天,带来了专为混合专家模型(MoE)和专家并行(EP)打造的高效通信库 — DeepEP。就在半小时前,官方对此进行了发布,以下是由赛博禅心带来的详解。

来自主题: AI技术研报
10480 点击    2025-02-25 11:18