Qwen3.6-Plus 深度测评报告
Qwen3.6-Plus 深度测评报告本报告基于XSCT Arena平台,对 Qwen3.6-Plus-Preview(阿里云,2026-04-02 发布)在文字能力(xsct-l)、网页生成(xsct-w)、Agentic 任务(xsct-a)三大场景下的表现进行系统评测,并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、
本报告基于XSCT Arena平台,对 Qwen3.6-Plus-Preview(阿里云,2026-04-02 发布)在文字能力(xsct-l)、网页生成(xsct-w)、Agentic 任务(xsct-a)三大场景下的表现进行系统评测,并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、
Salesforce 是一家云软件巨头,一直在围绕 AI 重塑其业务,在周二于旧金山举行的一次小型聚会上,首席执行官马克·贝尼奥夫及其团队公布了这些努力的最新成果:Slack 的更新版本,配备了大量新的 AI 功能。其中最重要的是其 AI 助手 Slackbot 的重大升级
我的Claude Code,学会做梦了。说真的,我打这行字的时候自己都觉得有点离谱。事情是这样的。就在前些日子,Anthropic新出了一个功能叫Auto Dream,字面意思,让Agent在休息的时候,自动做梦。
快手的这篇论文,正是对这一问题交出的一份沉甸甸的工业级答卷。他们提出了 GR4AD(Generative Recommendation for ADvertising),一个横跨表征、学习、服务三大层面协同设计的生成式广告推荐系统,并已全量部署于快手广告平台,服务超过 4 亿用户。
就在今天凌晨,Cursor 3正式发布!自Cursor诞生以来的最大一次飞跃!X上Cursor的官方账号上发布的推文写得极其大胆:为所有代码都由Agent编写而建的世界,同时保持开发环境的深度
产品本身包括了一个Agentic Payment Skill,一个龙虾可以用的“虚拟卡包”,和一套他的围栏,(好像现在可以叫 Harness 了)。这些东西本身只是配套的 infra,核心在于商户的功能 Skill,服务于 Agent 的需求。商户会在 Skill 中引导用户授权 Agent,允许自主完成小额的支付。
谷歌深夜掏家底!Gemma 4全系开源,仅用31B越级斩杀20倍体量巨头。数学能力暴涨68%,硬生生把前代打成计量单位,开源界迎来终极大洗牌!
一家叫泛灵人工智能的团队,出了一款主打「超级办公助理」的硬件产品。
过去一年,AI 硬件很热,但很多从业者心里其实都清楚,热归热,真正做起来并不轻松。
Harness(驾驭)的风,终究还是从大模型,吹到了机器人!