废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26
废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26北大彭宇新团队提出「美学照片重构」新任务,从摄影教学视频中自动构建数据集AesRecon,并开发两阶段模型AesFormer,通过优化构图、视角与人物姿态,提升照片的美感与艺术表现力。
搜索
北大彭宇新团队提出「美学照片重构」新任务,从摄影教学视频中自动构建数据集AesRecon,并开发两阶段模型AesFormer,通过优化构图、视角与人物姿态,提升照片的美感与艺术表现力。
致力于成为金融界“DeepSeek”。金融垂域大模型公司Grace Investment Machine(简称GIM)宣布一连完成过亿元天使轮和天使+轮融资。成立于2025年7月,GIM正在做一件事:为金融行业打造一个垂直领域的DeepSeek——专为投资决策而生的推理大模型。
GPT-5.6发布候选版本kindle-alpha敲定,前端和视觉能力大幅跃升。与此同时,Claude Mythos 5在API中闪现又秒删。双雄争霸,好戏开始!
英国当地时间6月7日,据《金融时报》援引知情人士的话披露,OpenAI正准备对ChatGPT进行自2022年推出以来规模最大的改版,新版将在未来几周内逐步上线。
在具身智能最难的泛化问题上,他们连续拿出顶会级成果,并把它们沉淀进其创新 VLOA 大模型,推动机器人迈向广阔现实。
春节AI大战过去仅半年不到,千问、豆包这两大AI产品又在618期间隔空“赛跑”。 《读佳》获知,在618电商大促前夕,千问APP正悄悄内测“AI帮我挑”的全新功能,这是千问与淘宝全面互通后的又一关键布
6月1日,两件大事撞在了一起。
最近,有网友发现了 ChatGPT 一个奇怪的图片 bug。给它下面的提示词:
别把脑子外包出去。
一道悬了12年没人证出来的物理猜想,诺贝尔物理学奖得主Giorgio Parisi把它交给了Claude,模型几乎自己推出了完整证明。
空间智能与世界模型初创公司知天下(苏州)人工智能科技有限公司(以下简称“知天下”)近日已完成天使轮融资。知天下是一家专注于高斯泼溅(3D Gaussian Splatting,简称3DGS)三维重建与生成技术的AI企业,于 2024 年初推出 3DGS 免费重建与发布服务
两个三十岁出头的年轻人,正在靠AI向华尔街收每节课2.5万美元的学费,合人民币17万。
AI 是否有意识了?Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」,三大实验室同时下注 AI 意识研究;Hinton 认为 AI 已经有意识了,而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定;哈萨比斯从行业内部划清界限。这个问题的答案,正在重新定义通往 AGI 的路线图。
过去一年,AI 推理模型的使用成本让不少开发者叫苦。
2026 年 6 月的科罗拉多州丹佛市,全球计算机视觉与模式识别领域的顶级学术盛会 CVPR 正在召开,最前沿的视觉模型、机器人技术、下一代智能系统全都在同一个舞台上被反复讨论和辩证。
近年来,大语言模型在数学、代码等任务上的表现不断刷新上限,但到了医疗诊断、故障排查这类真实世界任务里,真正困难的是让多个智能体在不确定的动态环境中持续协作推理。
AI 在工作里真是越来越拟人了。
近年来,大语言模型能力的提升,已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径:通过多个专家模型的协作来完成生成任务。
35岁的周先生在杭州一家金融互联网企业担任AI大模型质检主管,负责对AI与用户交互生成的答案进行把关。2024年11月19日,他突然收到通知,从部门主管调至普通岗位,月薪也从2.5万元降到1.5万元,他拒绝接受。两个多月后,周先生被单方面解除劳动合同。
6月4日,Arena.ai发布Agent Arena排行榜,用373,431次真实会话的数据,给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”(Net Improvement),用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好,负值说明不如随机。
当资本疯狂涌入人形机器人本体,一家成立1个月的公司选择往下走一层,做所有机器人共同依赖的感知基础设施。三位创始人全部来自图灵奖得主Yoshua Bengio创立的Mila研究院生态。他们判断,最终拉开机器人差距的不是本体,而是对物理世界的理解与记忆。
而在这场狂欢中,受益者远远不止苹果一家。当地时间 6 月 5 日,著名单板计算机生产商树莓派(Raspberry Pi)宣布上调利润指引,2026年上半年预计出货超 400 万台,盈利“大幅超出市场预期”。截至当地时间 6 月 5 日晚七点,股价最新已达 1,051 便士,相较 2 月份的历史最低点(254 便士)翻了四倍多,市值已接近 20 亿英镑。
今日,OpenAI自研芯片“002号员工”Clive Chan在X平台发文宣布,自己已经离开OpenAI,并于本周正式加入Anthropic。在离职声明中,Clive Chan回顾了自己过去两年多在OpenAI的经历。他提到,自己是OpenAI硬件团队的第二位招聘员工,亲历了OpenAI自研芯片项目从早期组建到如今逐步推进的全过程。
奇点灵智做了一款支持 Vibe Coding 的儿童硬件。 产品叫多奇 AI 小外教机器人,面向 3-8 岁孩子。今年 1 月在京东首发,首发期间产品进入京东榜单 Top 2,目前全平台订单超过 2
近日,普林斯顿大学的研究团队发布了一篇新论文,提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型,是国内开源大模型 DeepSeek-V4-Flash。
6月1日,在英伟达GTC舞台,黄仁勋聊AI工厂,聊智能体,反复念叨的也是这个Token:算力就是收入,算力就是利润。没有收入和利润,就是亏损。一座AI工厂这辈子能赚多少钱,看的就是它总共产出多少Token,也就是曲线下方的面积。一句话:谁能更快、更省电、更稳定地生产Token,谁就赚得多。
该论文第一作者为曹子昂,研究方向主要聚焦于 3D AIGC、Physical AI 与具身智能。论文主要合作者包括来自南洋理工大学的李海天、姚润茂、洪方舟、陈昭熹,以及大晓机器人的刘英豪和潘亮。通讯作者为南洋理工大学刘子纬教授。
Codex和Claude Code长得越来越像了!最近,开发者Elie Bakouch感到Claude Code和Codex的功能越来越像,他好奇到底哪家在领跑,于是就把两家都有的功能做成了一张时间线。
近日,来自清华大学智能产业研究院(AIR)的团队联合北京智源研究院(BAAI)、北京大学、南京大学等机构构建了一个基准:GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark,
它不同于我们认知中传统的「学术机构」or「创业公司」。它要在同一个屋顶下,同时扛住四件事:科学路径是否成立、工程能不能跑通、市场有没有人买单、资本能不能撑到关键节点。硅谷现在有个非正式叫法:Neo Labs。