AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
又一位字节AI大将离职

又一位字节AI大将离职

又一位字节AI大将离职

3月12日,华尔街见闻获悉,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职。去年底,字节TikTok算法负责人陈志杰也被曝出离职创业。

来自主题: AI资讯
7430 点击    2025-03-13 11:51
蚂蚁医疗大模型拿下MedBench测评“双料”冠军

蚂蚁医疗大模型拿下MedBench测评“双料”冠军

蚂蚁医疗大模型拿下MedBench测评“双料”冠军

近日,记者发现,国内权威医疗大模型评测平台MedBench在官网更新了榜单。多个医疗AI产品及研究团队入榜,其中蚂蚁AI健康管家团队研发的蚂蚁医疗大模型以评测榜单97.5、自测榜单98.2的高分再度夺得双料冠军。

来自主题: AI资讯
8440 点击    2025-03-13 10:30
首篇AI自写论文通过ICLR 2025同行评审!6.25高分碾压人类,AI独挑科研大梁

首篇AI自写论文通过ICLR 2025同行评审!6.25高分碾压人类,AI独挑科研大梁

首篇AI自写论文通过ICLR 2025同行评审!6.25高分碾压人类,AI独挑科研大梁

Sakana AI刚刚官宣,第二代「AI科学家」独立完成论文,通过了ICLR 2025 Workshop的同行评审。这是首次完全由AI端到端生成的科学论文,获得了学术高度认可。

来自主题: AI技术研报
10578 点击    2025-03-13 10:08
我花了2天,找到了我觉得翻译质量最好的AI大模型。

我花了2天,找到了我觉得翻译质量最好的AI大模型。

我花了2天,找到了我觉得翻译质量最好的AI大模型。

网易有道这个老牌翻译厂商出的AI大模型子曰翻译2.0,居然吊打了一切。。。说说我们是怎么测大模型的翻译评测这块的。测试的维度也很简单,就从我平常受到的折磨体验出发,梳理出了2点。

来自主题: AI资讯
11747 点击    2025-03-13 09:34
曝两大巨头争投AI独角兽Anthropic,内幕:豪赌数百亿,进不去董事会

曝两大巨头争投AI独角兽Anthropic,内幕:豪赌数百亿,进不去董事会

曝两大巨头争投AI独角兽Anthropic,内幕:豪赌数百亿,进不去董事会

今天,外媒披露了谷歌在美国大模型独角兽Anthropic中的持股细节。相关文件显示,谷歌数年来累计对Anthropic注资30亿美元(约合人民币217亿元),换取了后者14%的股份。令人意外的是,这些投资并未让谷歌在Anthropic的运营中享有过多的话语权,但谷歌仍计划在今年9月以可转债的形式再追加7.5亿美元(约合人民币54亿元)投资。

来自主题: AI资讯
9625 点击    2025-03-12 20:20
刚刚,谷歌Gemma 3上线!单GPU最强多模态手机可跑,27B完胜o3-mini

刚刚,谷歌Gemma 3上线!单GPU最强多模态手机可跑,27B完胜o3-mini

刚刚,谷歌Gemma 3上线!单GPU最强多模态手机可跑,27B完胜o3-mini

就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。

来自主题: AI资讯
9982 点击    2025-03-12 18:43
32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero

32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero

32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero

Hugging Face的Open R1重磅升级,7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。

来自主题: AI资讯
9884 点击    2025-03-12 18:35
别再用AI写垃圾代码!4个技巧帮你用AI写出漂亮炫酷的应用

别再用AI写垃圾代码!4个技巧帮你用AI写出漂亮炫酷的应用

别再用AI写垃圾代码!4个技巧帮你用AI写出漂亮炫酷的应用

揭秘如何在 20 分钟内用 AI 创建专业级界面,并分享前四大核心技巧,让你的 AI 生成的应用脱胎换骨。 

来自主题: AI技术研报
6962 点击    2025-03-12 15:30
长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。

来自主题: AI技术研报
6028 点击    2025-03-12 15:08