AI资讯新闻榜单内容搜索-模型

长文本向量模型在4K Tokens 之外形同盲区？

2025 年 2 月发布的 NoLiMA 是一种大语言模型（LLM）长文本理解能力评估方法。不同于传统“大海捞针”（Needle-in-a-Haystack, NIAH）测试依赖关键词匹配的做法，它最大的特点是通过精心设计问题和关键信息，迫使模型进行深层语义理解和推理，才能从长文本中找到答案。

来自主题: AI技术研报

6413 点击 2025-03-12 15:08

DeepSearch 与 DeepResearch 的设计和实现

这才 2 月份，深度搜索（Deep Search）就已经隐隐成为 2025 年的新搜索标准了。像谷歌和 OpenAI 这样的巨头，纷纷亮出自己的“Deep Research”产品，努力抢占这波技术浪潮的先机。（我们也很自豪，在同一天也发布了开源的node-deepresearch）。

来自主题: AI技术研报

12213 点击 2025-03-12 14:55

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

在 ChatGPT 爆火两年多的时间里，大语言模型的上下文窗口长度基准线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。

来自主题: AI技术研报

9210 点击 2025-03-12 14:53

全国首个出生健康管理大模型CHANGE发布

3月6日上午，宁波市妇女儿童医学中心的产房中，小名思思的孩子呱呱坠地，医护人员为她进行了血氧饱和度测试以及心脏听诊，数据同步至“CHANGE大模型”（中文名启元大模型），几十秒钟后，大模型给出了“阳性”的红字提示，“是先天性心脏病，但是情况不严重，做好随访，3岁之前做一个微创手术就能根治。”医生安慰着思思的父母。

来自主题: AI资讯

8549 点击 2025-03-12 14:50