AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导

UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导

UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导

来自UCLA的华人团队提出一种全新的LLM自我对弈系统,能够让LLM自我合成数据,自我微调提升性能,甚至超过了用GPT-4作为专家模型指导的效果。

来自主题: AI技术研报
7793 点击    2024-02-02 17:27
最强开源多模态生成模型MM-Interleaved:首创特征同步器

最强开源多模态生成模型MM-Interleaved:首创特征同步器

最强开源多模态生成模型MM-Interleaved:首创特征同步器

过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。

来自主题: AI技术研报
8879 点击    2024-02-02 11:39
梭哈大模型的公司,给自己找了条退路

梭哈大模型的公司,给自己找了条退路

梭哈大模型的公司,给自己找了条退路

AI大模型在业界备受关注,但对于一些公司来说,采用小模型可能是一种更好的选择。微软已经开始研发小规模、低算力需求的模型,并组建新团队进行对话式AI的开发。而对于工业、金融和汽车等领域而言,小模型更易于落地,并且具有省电、省钱、省时间的优势。

来自主题: AI资讯
3612 点击    2024-02-01 22:49
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

删除权重矩阵的一些行和列,让 LLAMA-2 70B 的参数量减少 25%,模型还能保持 99% 的零样本任务性能,同时计算效率大大提升。这就是微软 SliceGPT 的威力。

来自主题: AI技术研报
4719 点击    2024-01-30 13:43
OpenAI出手后,GPT-4真的不懒了?

OpenAI出手后,GPT-4真的不懒了?

OpenAI出手后,GPT-4真的不懒了?

OpenAI 在一篇博文中发布了多项更新,并表示更新后的 GPT-4 Turbo“拥有比之前预览模型更好的代码生成等能力,且减少了模型在任务中途罢工的「变懒」情况。”但该公司并没有对更新内容做进一步解释。

来自主题: AI资讯
5380 点击    2024-01-30 11:32
哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。

来自主题: AI技术研报
9378 点击    2024-01-29 12:45
禁止云计算厂商为中国训练AI大模型,美国图啥?

禁止云计算厂商为中国训练AI大模型,美国图啥?

禁止云计算厂商为中国训练AI大模型,美国图啥?

美国计划限制中国客户使用美国云计算厂商的服务训练AI大模型,对中国人工智能产业造成潜在破坏。本文分析了中国科技行业追赶的三个因素。

来自主题: AI资讯
5011 点击    2024-01-29 10:12