AI资讯新闻榜单内容搜索-数据

更快、更强、更经济！港大开源大模型RAG系统LightRAG

LightRAG通过双层检索范式和基于图的索引策略提高了信息检索的全面性和效率，同时具备对新数据快速适应的能力。在多个数据集上的实验表明，LightRAG在检索准确性和响应多样性方面均优于现有的基线模型，并且在资源消耗和动态环境适应性方面表现更优，使其在实际应用中更为有效和经济。

来自主题: AI技术研报

8858 点击 2024-10-14 16:48

深度｜AI教父Hinton与AI教母李飞飞首次公开对谈：我们必须通过，让懂得数据的人和懂得如何使技术有效的人建立联系来搭建这座桥

经过三年的努力，ImageNet成为了一个包含1500万张互联网图像的数据集，涵盖了22000个物体类别概念。

来自主题: AI资讯

5737 点击 2024-10-14 15:56

Evaluation is All You Need！首个开源多模态大模型通用评测器LLaVA-Critic

随着对现有互联网数据的预训练逐渐成熟，研究的探索空间正由预训练转向后期训练（Post-training），OpenAI o1 的发布正彰显了这一点。

来自主题: AI技术研报

6685 点击 2024-10-14 15:46

李飞飞「数字表兄弟」破解机器人训练难题！零样本sim2real成功率高达90%

在用模拟环境训练机器人时，所用的数据与真实世界存在着巨大的差异。为此，李飞飞团队提出「数字表亲」，这种虚拟资产既具备数字孪生的优势，还能补足泛化能力的不足，并大大降低了成本。

来自主题: AI技术研报

8101 点击 2024-10-14 15:30

AI作曲缺数据，浙大GTSinger数据集上线：适配所有歌声任务、带有真实乐谱

传统的歌声任务，如歌声合成，大多是在利用输入的歌词和乐谱生成高质量的歌声。随着深度学习的发展，人们希望实现可控和能个性化定制的歌声生成。

来自主题: AI技术研报

8105 点击 2024-10-14 10:38

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

1%的合成数据，就让LLM完全崩溃了？ 7月，登上Nature封面一篇论文证实，用合成数据训练模型就相当于「近亲繁殖」，9次迭代后就会让模型原地崩溃。

来自主题: AI技术研报

6334 点击 2024-10-14 10:12

长文本、语音、视觉、结构化数据全覆盖，中国移动九天善智多模态大模型震撼发布

善智者，动于九天之上。

来自主题: AI资讯

7692 点击 2024-10-14 09:59

深度｜普林斯顿教授Arvind：构建大参数模型不再有效，数据正成为瓶颈；社会对AI过度恐惧

计算资源并非性能提升的唯一途径：Arvind Narayanan 认为，仅仅增加计算资源并不总是能带来模型性能的等比提升。目前，数据量正逐渐成为限制AI发展的主要瓶颈。

来自主题: AI资讯

6030 点击 2024-10-14 09:17

杨立昆最新采访：AI威胁论是胡说八道，堆砌芯片和数据不能实现AGI

杨立昆认为人工智能还有很长的路要走。

来自主题: AI资讯

5815 点击 2024-10-13 09:14

微软推出AI医疗工具全家桶，预览医疗数据方向5大新功能

微软发表了一篇播客，宣布在其Microsoft Cloud for Healthcare中推出新的医疗保健数据功能和AI工具，包括通过Azure AI Studio中的新医疗保健AI模型、Microsoft Fabric中的医疗保健数据功能、Copilot Studio中的医疗保健AI agents服务以及AI驱动的护理工作流程解决方案。

来自主题: AI资讯

5617 点击 2024-10-12 10:26