万字长文解读Scaling Law的一切,洞见LLM的未来
万字长文解读Scaling Law的一切,洞见LLM的未来近日,资深机器学习研究科学家 Cameron R. Wolfe 更新了一篇超长的博客文章,详细介绍了 LLM scaling 的当前状况,并分享了他对 AI 研究未来的看法。
搜索
近日,资深机器学习研究科学家 Cameron R. Wolfe 更新了一篇超长的博客文章,详细介绍了 LLM scaling 的当前状况,并分享了他对 AI 研究未来的看法。
2025年1月中旬,英伟达CEO黄仁勋的中国之行备受瞩目。从北京到深圳,再到台中和上海,这位AI时代的“卖铲人”每到一处都掀起一阵热潮。然而,就在距离英伟达上海办公室仅200公里的杭州,一场足以撼动AI产业格局的风暴正在悄然酝酿。
1942年,伟大的科幻作家艾萨克·阿西莫夫(Isaac Asimov)在他的短篇小说《转圈圈》(Runaround)中首次提出了“机器人三定律”。之后,这些定律因为他的短篇小说集《我,机器人》而广为流传。
DeepSeek震动硅谷,其高性价比的训练技术引发了市场的广泛关注。在最新发布的研报中,花旗分析师Atif Malik、Asiya Merchant等详细分析了DeepSeek对AI基建产业链各环节的潜在影响,揭示了哪些环节将受益,哪些环节可能面临挑战。
奥斯卡提名的热门影片《粗野派》的剪辑师最近透露,电影中采用了AI技术,让主演阿德里安·布洛迪和菲丽希缇·琼斯的匈牙利语对话更加自然真实,即使他们都接受过严格的语音训练。
国产大模型云服务平台SiliconCloud(硅基流动),首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。 DeepSeek-V3:输入只需1块钱/M tokens,输出2块钱/M tokens
除夕前两篇爆款文章在网上流行。一篇是英伟达创始人黄仁勋回应Deepseek的内部信,一篇是幻方/Deepseek创始人梁文锋回应冯骥国运级科技的说法,都是至少十万+的阅读。可惜两篇都是假的。各渠道已经辟谣。
AI系统生成的内容是否享有版权保护,美国政府机构在最新法规指引中给出了他们的看法。
继《换你来当爹》和《灵魂提取器》风靡之后,「狸谱」在春节期间,又上线了《万物变挂件》和《新年萌偶摇》的新玩法。
春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。