AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
模型融合、混合专家、更小的LLM,几篇论文看懂2024年LLM发展方向

模型融合、混合专家、更小的LLM,几篇论文看懂2024年LLM发展方向

模型融合、混合专家、更小的LLM,几篇论文看懂2024年LLM发展方向

在过去的 2023 年中,大型语言模型(LLM)在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展,似乎我们即将进入一个可喜的新阶段:在不增大模型规模的前提下让模型变得更好,甚至让模型变得更小。

来自主题: AI技术研报
6320 点击    2024-02-22 15:31
阿里大模型员工也自曝了996作息表

阿里大模型员工也自曝了996作息表

阿里大模型员工也自曝了996作息表

思维链作者、从谷歌跳槽OpenAI的Jason Wei前脚刚自曝996作息表,国内的“卷王”们就按耐不住了。

来自主题: AI资讯
10972 点击    2024-02-22 15:07
开源大模型王座易主,谷歌Gemma杀入场,笔记本可跑,可商用

开源大模型王座易主,谷歌Gemma杀入场,笔记本可跑,可商用

开源大模型王座易主,谷歌Gemma杀入场,笔记本可跑,可商用

刚刚,谷歌杀入开源大模型。谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。

来自主题: AI资讯
9555 点击    2024-02-22 11:52
AIGC爆火,第一家要倒下的大模型企业出现了?

AIGC爆火,第一家要倒下的大模型企业出现了?

AIGC爆火,第一家要倒下的大模型企业出现了?

2月21日,知名AI创业公司竹间智能突然宣布因业务需求减少,给公司带来了严重的现金流压力和挑战,停工停产6个月。

来自主题: AI资讯
7567 点击    2024-02-22 11:45
金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强? Deepmoney金融大模型魔改方案分享&在线实测

金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强? Deepmoney金融大模型魔改方案分享&在线实测

金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强? Deepmoney金融大模型魔改方案分享&在线实测

在微调大型模型的过程中,一个常用的策略是“知识蒸馏”,这意味着借助高性能模型,如GPT-4,来优化性能较低的开源模型。这种方法背后隐含的哲学理念与logos中心论相似,把GPT-4等模型视为更接近唯一的逻辑或真理的存在。

来自主题: AI资讯
9125 点击    2024-02-21 16:49
运行LIama2得8400万元!最快AI推理芯片成本推算引热议

运行LIama2得8400万元!最快AI推理芯片成本推算引热议

运行LIama2得8400万元!最快AI推理芯片成本推算引热议

这两天,Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片,实现每秒500tokens大模型生成,感受不到任何延迟。外加谷歌TPU团队这样一个高精尖人才Buff,让不少人直呼:英伟达要被碾压了……

来自主题: AI资讯
4770 点击    2024-02-21 16:39
宾夕法尼亚大学推出 AI 学位课程,开启未来科技新纪元

宾夕法尼亚大学推出 AI 学位课程,开启未来科技新纪元

宾夕法尼亚大学推出 AI 学位课程,开启未来科技新纪元

在人工智能领域,OpenAI 继其 GPT-4 模型后,再次引领科技风潮,近期发布了令人瞩目的文生视频大模型 Sora。这一创新不仅再次证明了 AI 技术的无限潜力,也加速了全球对人工智能专业人才的追求。宾夕法尼亚大学工程学院顺应时代潮流,宣布推出一个全新的人工智能(AI)专业的工程学士学位课程,以培育未来将在这一领域引领变革的杰出人才。

来自主题: AI资讯
10255 点击    2024-02-21 11:51