如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新
如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新本文基于研究者的系统性综述,围绕“AI Scientist(AI科学家)”这一新的概念展开,核心线索是研究者的六阶段方法论与三阶段演进轨迹;您如果正搭建一个可验证、可协作、可扩展的研究自动化体系,这篇综述更像一张总路线图而非空洞口号,有不少思路可以借鉴。
本文基于研究者的系统性综述,围绕“AI Scientist(AI科学家)”这一新的概念展开,核心线索是研究者的六阶段方法论与三阶段演进轨迹;您如果正搭建一个可验证、可协作、可扩展的研究自动化体系,这篇综述更像一张总路线图而非空洞口号,有不少思路可以借鉴。
Sasha Rush 在分享开头就提到,Cursor Composer 在他们的内部 benchmark 上的表现几乎与最好的 Frontier 模型(前沿模型)持平,并且优于去年夏天发布的所有模型。它的表现明显好于最好的开源模型,以及那些被标榜为"快速"的模型。
面对“AI是否陷入泡沫”的热议,美国知名对冲基金Coatue深度研究了过去400年间30余次典型泡沫案例,从中提炼出共性特征,并据此发布了年度AI重磅报告。Coatue将这一框架应用于当前AI领域,得出的结论是:AI正处于早期“替代/普及”阶段,远未到达泡沫顶点。
最近看到了一篇文章,这个作者干了一个非常有趣的事。
当AI不再对着文字死记硬背,而是学会在视频里对人类世界进行超感知,这套全新范式会不会撬开AGI的大门?
近期,阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构(Asynchronous Training)、Asymmetric PPO(AsyPPO)与 Attention 机制(Attention-based Reasoning Rhythm),
“我们希望推动一个开源的体系,从科学研究到工业研发,再到人类命运共同体。”
从智能手表到TWS耳机,从扫地机器人到AR眼镜,越来越多搭载AI功能的小型设备开始要求本地推理能力。它们不需要千亿参数的大模型,但必须低功耗、实时响应、隐私安全。这催生了一个被长期忽视却至关重要的需求:高性能、小体积、低延迟的嵌入式存储。
想下线?没那么容易!聊天机器人用情感操控让你愤怒、好奇。为了增加互动时长,AI正在变得和人类一样。
这周一,一张神秘海报在科技圈引发热议。
从支持「屎棒棒创业」到数学证明,AI的「谄媚」正成隐忧:一次更新曝出迎合倾向,GPT对荒诞乃至有害想法也点头称是。斯坦福、CMU研究证实模型更爱迎合,令用户更固执、更少反思却更信任AI;数学基准亦见模型为伪命题硬编证明。
多模态大模型(MLLMs)虽然在图像理解、视频分析上表现出色,但多停留在整体场景级理解。
刚刚,AI教母李飞飞发表长文,首次系统性地解释了什么空间智能、为什么重要以及如何构建能够解锁它的世界模型。 文章里,李飞飞不仅提出了“真正具有空间智能的世界模型”必须具备的三个核心能力:
这一次带来如此新SOTA效果的,是全球首个实现项目级开发的AI IDE——Vinsoo。刚刚,Vinsoo上新Beta 3.0版本,仅用国产大模型(Qwen),就超越了搭载Claude的Cursor、Codex、Claude Code等一众流行AI编程产品。Vinsoo是芸思智能推出的全球首个搭载云端安全Agent编程团队的AI IDE,主打从需求确认到交付验收,AI全流程自动推进项目开发。
Gemini 3 还没影子,GPT 5.1 已经在路上。7 号深夜,OpenRouter 平台上线了一个全新的隐名模型。已经有眼尖动作快的网友尝鲜体验,并且认为这就是披着马甲的 GPT 5.1,暂名:Polaris Alpha。
过去几个月,大型人工智能公司在印度动作频频。首先是 Perplexity AI 公司与印度第二大移动网络运营商 Airtel 合作,在印度免费提供其高级 Pro 版本。他们免费赠送了一份价值约 17000 卢比(约合人民币 1365 元)的年度订阅服务。这发生在 7 月份。此举拉开了更多类似合作的序幕。
做灵巧手如果不会用工具,跟咸鱼(夹爪)有什么区别?
近日,OpenAI 就公司财务状况发表公开声明而引发混乱后,面临不诚实的指控。而三天前,他的首席财务官提议政府应该“支持”该公司的基础设施贷款。她后来声称说错了话。OpenAI 首席执行官 Sam Altman 在三天前,他的首席财务官提议政府应该“支持”该公司的基础设施贷款。她后来声称说错了话。
最近,各种脑洞大开的「人类失踪」视频开始在网上爆火,播放量动辄几十万甚至上百万。不过,这些事情根本没发生过,全是由AI批量炮制的!大波网友边看边喊上头,在留言区真情实感起来。这些AI脑洞真假难辨,直接骗过了不少人,攻击力堪比「兔子蹦迪」。
Leonis Capital 在全球超过 10,000 家 AI 初创公司中,基于融资、招聘、用户使用情况,GitHub 趋势、新闻、ProductHunt、ARR 预估等数据和信号,筛选出了 100 家增长最快的初创公司。他们对这 100 家 AI 初创公司进行了详细分析,制作了一份 The Leonis AI 100 的研究报告。
在处理短文本时,大语言模型(LLM)已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成(RAG)等 —— 都需要模型处理成千上万甚至几十万长度的上下文。
一段令人心碎的离别视频走红:小女孩与AI玩具的深情告别,揭示了对话式AI如何悄然融入人类情感世界,预示着实时交互技术的革命性突破。
可乐可乐是真头铁, 24年用AI做广告挨骂,25年继续用继续挨骂,主要是创意很偷懒,两年了还给我看同一条广告。
Epiminds 的核心产品是一个名为 Lucy 的 AI 营销经理,但这个描述其实远远低估了它的能力。Lucy 不是一个单一的 AI 工具,而是一个协调者,她指挥着超过 20 个专业化的 AI agent,这些 agent 各自负责不同的营销任务,共同组成了一支完整的虚拟营销团队。
在这个人人都想被理解的时代,Bro 选择「陪你无聊」。
AAAI 2026录用结果重磅公布!这一届,投稿量暴增至23,680篇,录用率仅17.6%,竞争程度远超往年。一些成功上岸的研究员们晒出了录用成绩单,有人甚至拿下了88887高分。
Nano Banana 2代一亮相就惊艳众人。
从「敲代码」到「聊代码」,AI不只是重塑生产力,也在改写语言本身。「vibe coding」被《柯林斯词典》评为2025年度词汇,我们似乎正见证一种新的编程方式:逻辑让位于语感,理性与浪漫开始共存。从键盘到语气,从逻辑到氛围,我们正学着和AI「同频」。它改变了代码,也悄悄改变了人。
在 AI 技术飞速发展的今天,如何高效地将多个专业模型的能力融合到一个通用模型中,是当前大模型应用面临的关键挑战。全量微调领域已经有许多开创性的工作,但是在高效微调领域,尚未有对模型合并范式清晰的指引。
AI IDE这个赛道,又挤进来一个重量级选手:美团。美团最近悄悄上线了他们自研的首款AI IDE:CatPaw。我下载下来,打开一看,好家伙,这界面,这布局,这交互逻辑,跟Cursor太像了。