AI资讯新闻榜单内容搜索-数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据
国产超算生成式压缩模型训练性能突破2.16 EFLOP/s,支撑全球遥感数据万倍级压缩

国产超算生成式压缩模型训练性能突破2.16 EFLOP/s,支撑全球遥感数据万倍级压缩

国产超算生成式压缩模型训练性能突破2.16 EFLOP/s,支撑全球遥感数据万倍级压缩

随着全球遥感卫星持续运行,地球观测数据正在快速增长。多源、多时相、多光谱遥感影像为国土监测、生态评估、灾害预警、气候变化研究等任务提供了重要数据基础,但也带来了显著的存储、传输和计算压力。

来自主题: AI技术研报
9249 点击    2026-05-29 09:39
刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

2026 年初,国内具身智能赛道掀起了一波开源潮,越来越多团队开始公开自己的视觉-语言-动作(VLA)模型、数据集与训练框架。与此同时,行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上,尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报
8306 点击    2026-05-29 09:19
多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是:当模型参数量、数据量和训练计算量增加后,loss 会如何下降。

来自主题: AI技术研报
6661 点击    2026-05-29 09:19
GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?

GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?

GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?

Epoch AI刚刚发布的《梯度更新》报告,做了一件简单粗暴的事:把全球所有Blackwell芯片能处理的Token数量算出来,再和实际需求一比。结论只有一个字——不够。

来自主题: AI技术研报
8497 点击    2026-05-28 20:59
首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

近期,深圳河套学院(SLAI)AI训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳大数据研究院、华为GTS(全球技术服务)团队与深智城AI算力平台,仅用1个月,共同基于昇腾910C国产算力集群实现DeepSeek-V4-Pro全参数续训练/SFT稳定运行,完成长稳训练1500+步,训练MFU超30%,关键训练算子效率提升14%。

来自主题: AI技术研报
9229 点击    2026-05-28 14:56
老黄不只卖铲子了!英伟达要当AI产业链的「收租人」

老黄不只卖铲子了!英伟达要当AI产业链的「收租人」

老黄不只卖铲子了!英伟达要当AI产业链的「收租人」

刚刚,英伟达再次甩出一份炸裂财报:单季营收816亿美元,光数据中心一项就占了92%。但真正应当注意的,是财报中一个一年翻了近29倍的数字。它背后,是英伟达正在悄悄完成的身份转换:从「卖铲子的人」,变成整条AI产业链的「收租人」。

来自主题: AI资讯
8981 点击    2026-05-28 10:20
这家创业公司发现了大模型的一个根本性缺陷

这家创业公司发现了大模型的一个根本性缺陷

这家创业公司发现了大模型的一个根本性缺陷

你有没有想过,我们每天用的 AI 大模型,可能在某些词汇上天生就有缺陷?不是因为训练数据不够,不是因为算力不足,而是因为语言本身的规律——那些用得少的词,模型就是学不好。更让人意外的是,这个问题早在 2025 年就被一家中国创业公司系统性地发现并解决了。

来自主题: AI技术研报
7123 点击    2026-05-28 09:52
Z Tech|对话Andrew Dai:14年DeepMind生涯,见证PaLM到Gemini,下一站押注视觉推理

Z Tech|对话Andrew Dai:14年DeepMind生涯,见证PaLM到Gemini,下一站押注视觉推理

Z Tech|对话Andrew Dai:14年DeepMind生涯,见证PaLM到Gemini,下一站押注视觉推理

过去十年,大模型世界里很多最关键的技术路线背后,都能看到Andrew Dai的身影。从早期预训练与监督微调,到后来主流的MoE(Mixture of Experts)架构;从Google Brain最初只有几十人的研究时代,到后来支撑Gemini的大规模数据体系,这位在 Google 工作超过14年的研究科学家,几乎站在了大模型时代每一次关键转折的现场。

来自主题: AI资讯
9295 点击    2026-05-27 16:31