AI资讯新闻榜单内容搜索-N2

Wan2.2-Animate又火了，5分钟让抠脚大汉秒变高冷女神。

最近，一个视频在推上传疯了。

来自主题: AI资讯

9761 点击 2025-10-30 11:47

3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B

今天推荐一个 Dense Image Captioning 的最新技术 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功将 DeepSeek-R1 的强化学习方法应用到 image captioning 这种开放视觉任务，创新的以实用性重新定义 image captioning 的 reward。

来自主题: AI技术研报

10657 点击 2025-10-29 10:24

十亿级参数，千亿级性能，上海AI Lab发布新一代文档解析大模型，复杂场景解析精度媲美人类专家

上海人工智能实验室发布新一代文档解析大模型——MinerU2.5。作为MinerU系列最新成果，该模型仅以1.2B参数规模，就在OmniDocBench、olmOCR-bench、Ocean-OCR等权威评测上，全面超越Gemini2.5-Pro、GPT-4o、Qwen2.5-VL-72B等主流通用大模型，以及dots.ocr、MonkeyOCR、PP-StructureV3等专业文档解析工具。

来自主题: AI技术研报

10059 点击 2025-09-30 10:45

Sora 2瑟瑟发抖！通义万相2.5放大招：一句话出1080P电影，音画精准同步

Veo 3真正对手，竟不是Sora 2！通义万相2.5全网首发，直接甩出王炸：一句话，直出10秒1080P电影级视频，首次实现音画精准同步。一键生成BGM、人声，全网实测玩疯。

来自主题: AI资讯

10922 点击 2025-09-25 16:04

Wan2.5+Midjourney V7，阿里夸克这个新AI鲨疯了！价格还砍一大刀

夸克“造点”AI发布了！直接上大招，Wan2.5+Midjourney V7双强模型联合！夸克“造点”还在今天第一时间，率先接入了阿里自家刚刚发布的视频生成模型通义万相Wan2.5，甚至直接开放了7天免费体验。

来自主题: AI资讯

10764 点击 2025-09-25 11:37

扩散语言模型有MoE版了！蚂蚁&人大从头训练LLaDA-MoE，将完全开源

挑战自回归的扩散语言模型刚刚迎来了一个新里程碑：蚂蚁集团和人大联合团队用 20T 数据，从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数仅 1.4B，但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B，而且推理速度更快。这为扩散语言模型的技术可行性提供了关键验证。

来自主题: AI技术研报

9774 点击 2025-09-15 08:30

断供？会“刻意练习”的Qwen2.5-3B，竟然超越Claude3.5！斯坦福最新

来自斯坦福的研究者们最近发布的一篇论文（https://arxiv.org/abs/2509.01684）直指RL强化学习在机器学习工程（Machine Learning Engineering）领域的两个关键问题，并克服了它们，最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示（prompting）的、规模更大的静态语言模型Claude3.5。

来自主题: AI资讯

8782 点击 2025-09-06 11:35