AI资讯新闻榜单内容搜索-7

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 7
阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

继 Step 3.5 Flash 后,阶跃星辰最近又推出新一代高效率 Flash 开源模型 ——Step 3.7 Flash。该模型最大特点就是多(模)、快(速)、好(用)、省(钱)。总参数 196B,采用稀疏 MoE 架构,推理激活参数仅 11B,配备 1.88B ViT 视觉编码器,推理速度最高 400 TPS,支持 256K 上下文。

来自主题: AI资讯
9555 点击    2026-05-29 17:06
Anthropic官宣融资4407亿,估值超越Openai,同时最强通用模型 Claude Opus 4.8 登场

Anthropic官宣融资4407亿,估值超越Openai,同时最强通用模型 Claude Opus 4.8 登场

Anthropic官宣融资4407亿,估值超越Openai,同时最强通用模型 Claude Opus 4.8 登场

Anthropic最强通用模型Claude Opus 4.8正式发布,新模型基准测试全面超越Gemini 3.1 Pro、Opus 4.7,仅一项逊色于GPT-5.5,但其标准模式价格不变,快速模式价格仅为Opus 4.7的1/3。与此同时,Anthropic还官宣一笔650亿美元(约合人民币4406.94亿元)H轮巨额融资,投后估值冲上9650亿美元(约合人民币6.54万亿元)

来自主题: AI资讯
10349 点击    2026-05-29 10:40
GPT-5.5彻底击穿300个黑客评测任务,仅需5000万Token!

GPT-5.5彻底击穿300个黑客评测任务,仅需5000万Token!

GPT-5.5彻底击穿300个黑客评测任务,仅需5000万Token!

GPT-5.5 把进攻性网络安全最难的 7 个基准全部打穿,92.4% 正确率,评估体系直接失灵。AI 黑客能力每 6 个月翻一倍,而衡量它有多危险的尺子,已经先被干碎了。

来自主题: AI资讯
9469 点击    2026-05-29 10:11
刚刚,Claude Opus 4.8来了!两个史上首次改写历史

刚刚,Claude Opus 4.8来了!两个史上首次改写历史

刚刚,Claude Opus 4.8来了!两个史上首次改写历史

Opus 4.7发布刚43天,Opus 4.8就来了!编程实力暴增,全面霸榜。Claude Code一口气放出上百个agent并行干活,一个人11天就能重写75万行代码、99.8%测试通过。更狠的Claude Mythos,几周后就来。

来自主题: AI资讯
9272 点击    2026-05-29 09:00
面壁智能开源Agent神器PilotDeck,让Token成本狂降70%!

面壁智能开源Agent神器PilotDeck,让Token成本狂降70%!

面壁智能开源Agent神器PilotDeck,让Token成本狂降70%!

刚刚,清华团队开源硬核Agent系统PilotDeck,在开发者圈已经传疯了。项目独立建舱,记忆可视可改,Token还能省一大半。从此,一个人,就是一支AI军团!

来自主题: AI资讯
6206 点击    2026-05-28 15:14
百亿体检龙头,成立一家AI医疗!牵手华为、阿里,收入暴涨71.89%!

百亿体检龙头,成立一家AI医疗!牵手华为、阿里,收入暴涨71.89%!

百亿体检龙头,成立一家AI医疗!牵手华为、阿里,收入暴涨71.89%!

近日,企查查股权穿透显示,体检龙头美年健康(002044.SZ)间接全资持股了一家全新的AI企业上海数康达科技有限公司。

来自主题: AI资讯
8551 点击    2026-05-28 15:12
DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评
9915 点击    2026-05-28 12:06