AI资讯新闻榜单内容搜索-数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据
别问树模型了!死磕结构化数据,清华团队把大模型表格理解推到极限

别问树模型了!死磕结构化数据,清华团队把大模型表格理解推到极限

别问树模型了!死磕结构化数据,清华团队把大模型表格理解推到极限

科幻作家刘慈欣在小说《超新星纪元》中描述了一个令人难忘的场景——几个十几岁的孩子被带到一个小山环绕的地方,他们的面前是一条单轨铁路,上面停着十一列载货火车,每列车有二十节车皮。这些车首尾相接成一个巨大的弧形,根本看不到尽头。这些车中,其中一列装的是味精,另外十列装的是盐。

来自主题: AI技术研报
8245 点击    2025-11-24 10:44
Scaling Law的焦虑差距可以由「交互深度」解决,MiroMind用Qwen3-72B在GAIA中超越GPT5

Scaling Law的焦虑差距可以由「交互深度」解决,MiroMind用Qwen3-72B在GAIA中超越GPT5

Scaling Law的焦虑差距可以由「交互深度」解决,MiroMind用Qwen3-72B在GAIA中超越GPT5

在过去五年,AI领域一直被一条“铁律”所支配,Scaling Law(扩展定律)。它如同计算领域的摩尔定律一般,简单、粗暴、却魔力无穷:投入更多的数据、更多的参数、更多的算力,模型的性能就会线性且可预测地增长。无数的团队,无论是开源巨头还是商业实验室,都将希望孤注一掷地押在了这条唯一的救命稻草上。

来自主题: AI技术研报
6451 点击    2025-11-24 10:19
月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant

月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant

月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant

业务团队可能说他们想要个负重一吨,时速两百公里的马车…… 现如今,借助向量检索能力,实现基于语义相似度的智能搜索,已经是所有电商、推荐、社区平台技术架构的重要一环。 作为拥有约 1.08 亿日活、 1

来自主题: AI技术研报
10316 点击    2025-11-23 19:38
振臂一挥,大半个具身机器人圈都来了!智源研究院:别藏了,谁贡献数据多,谁的大脑就更好用

振臂一挥,大半个具身机器人圈都来了!智源研究院:别藏了,谁贡献数据多,谁的大脑就更好用

振臂一挥,大半个具身机器人圈都来了!智源研究院:别藏了,谁贡献数据多,谁的大脑就更好用

昨天,具身智能的圈子“炸”了。不是因为某家公司发布了新产品,而是因为一场“具身武林大会”—— 2025智源具身智能Open Day。现场有多火爆?这么说吧,银河通用、智元、星海图、自变量、原力灵机、加速进化、北京人形、星源智、优必选、

来自主题: AI资讯
8499 点击    2025-11-21 16:58
独家|数创弧光连融两轮估值数亿,解码大模型时代的“数据破壁者”

独家|数创弧光连融两轮估值数亿,解码大模型时代的“数据破壁者”

独家|数创弧光连融两轮估值数亿,解码大模型时代的“数据破壁者”

ZP独家获悉,聚焦大模型合成数据领域的 AI 创业公司“数创弧光(DataArc)”已于近期连续完成种子轮及种子+轮融资,累计融资额达数千万元人民币,投后估值数亿元。两轮融资分别由英诺天使基金与东方富海领投,君科丹木、数字未来、启迪之星等一线财务投资机构,以及深智城、头部云厂商等产业资本共同参与。

来自主题: AI资讯
11115 点击    2025-11-20 16:23
AI Agent 工程化,本质是数据库系统设计

AI Agent 工程化,本质是数据库系统设计

AI Agent 工程化,本质是数据库系统设计

最近半年,我阅读了业界关于 AI Agent 的工程实践:Anthropic 的 Context Engineering 论文、Manus 的工程分享、Cline 的 Memory Bank 设计等。同时自己也一直在做跟 AI Agent 相关的项目,如:Jta[1](开源的翻译 Agent,基于 Agentic Workflow)。

来自主题: AI技术研报
9023 点击    2025-11-20 15:03
NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

在视觉处理任务中,Vision Transformers(ViTs)已发展成为主流架构。然而,近期研究表明,ViT 模型的密集特征中会出现部分与局部语义不一致的伪影(artifact),进而削弱模型在精细定位类任务中的性能表现。因此,如何在不耗费大量计算资源的前提下,保留 ViT 模型预训练核心信息并消除密集特征中的伪影?

来自主题: AI技术研报
8191 点击    2025-11-20 09:33
原腾讯Robotics X算法研究员创业,4个月获3轮融资,要在3-5年将人形机器人送进家庭

原腾讯Robotics X算法研究员创业,4个月获3轮融资,要在3-5年将人形机器人送进家庭

原腾讯Robotics X算法研究员创业,4个月获3轮融资,要在3-5年将人形机器人送进家庭

在腾讯四年,朱庆旭曾将多种训练数据喂给具身模型,最终他得出结论:“基于遥操作数据训练的主流方案,有着原理性缺陷。”

来自主题: AI资讯
8837 点击    2025-11-19 17:13
登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」

登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」

登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」

在过去两年,大语言模型 (LLM) + 外部工具的能力,已成为推动 AI 从 “会说” 走向 “会做” 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执行等场景中,大模型要想精准调用工具,不仅要求模型本身具备推理能力,还需要借助海量高质量、针对性强的函数调用训练数据。

来自主题: AI技术研报
11272 点击    2025-11-19 16:40