红杉 xbench:AI 去药企做实习,遥遥领先了人类
红杉 xbench:AI 去药企做实习,遥遥领先了人类xbench,就是红杉自己弄的那个中立评测lab,刚刚又整了个新活:让 AI 做药企的数据分析,跟人类实习生比个高低,然后遥遥领先的赢了
搜索
xbench,就是红杉自己弄的那个中立评测lab,刚刚又整了个新活:让 AI 做药企的数据分析,跟人类实习生比个高低,然后遥遥领先的赢了
AI内容创作工具迈入Next Level!
本周四,Google DeepMind 宣布他们又要开始打游戏了。这次目标还是全世界最硬核的那一款:EVE Online。Google DeepMind 此次宣布收购著名科幻在线角色扮演游戏《EVE Online》(星战前夜)开发商的部分股权,并表示将利用该游戏研究「复杂、动态、玩家驱动的系统中的智能」。
英国AI音频独角兽ElevenLabs披露了其D轮融资新的投资者,同时透露其ARR(年度经常性收入)已突破5亿美元(约合人民币34.1亿元)。奥斯卡影帝杰米·福克斯、演员伊娃·朗格利亚等30余位创意人士首次成为股东。
吴恩达老师又出新课了。5月1号刚刚上线的这次教的是提示词。课程名叫 AI Prompting for Everyone,在 DeepLearning.AI 平台上线,由吴恩达本人主讲,面向所有人,不需要任何技术背景。
EverMind 想做点不一样的。这家由盛大集团孵化的公司,定位是为所有AI Agent提供一个通用的"记忆层"(Memory Layer)。它的核心产品EverOS是一套开源的长期记忆系统,开发者可以把它接入自己的Agent,让AI不仅能记住用户的历史对话和偏好,还能像人一样对记忆进行整理、更新,甚至从过去的经验中学习和进化。
社交网络应用 Series 宣布已筹集 510 万美元的种子前轮融资,投资者包括 Venmo 联合创始人 Iqram Magdon-Ismail、Pear VC、Reddit 首席执行官 Steve Huffman 以及 GPTZero 创始人 Edward Tian。该公司由耶鲁大学学生 Nathaneo Johnson 和 Sean Hargrow 于去年初创立,两人目前仍在该校就读大四。
要说也真够逗的,索尼的机器人又开始找画面了。
4 月 20 日,Meta 和房地产与基建服务公司 CBRE 联合宣布推出 LevelUp,一个四周、完全免费的光纤技术员培训项目。今年夏天起,它将为 Meta 的美国数据中心工地培养 “数千名” 没有任何行业经验的新手。
随着新一代主动执行型 Agent(如 OpenClaw、Hermes Agent 等)的爆发,AI 正经历从「被动工具」向「具备自我演化(Self-Evolving)能力的智能体」的范式跃迁。然而,受限于上下文窗口极限与记忆缺失,现有 Agent 难以在复杂任务中实现经验的复用与自我进化。