0.2美元微调就能让ChatGPT彻底破防
0.2美元微调就能让ChatGPT彻底破防微调LLM需谨慎,用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!
微调LLM需谨慎,用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!
清华大学自动化系汪小我团队在 Nature Communications 期刊发表论文,研究提出了一种将专家知识与大数据学习相融合的合成启动子人工智能辅助设计方法——DeepSEED
悟道·天鹰Aquila大语言模型系列全面升级到Aquila2,并再添 340亿参数(34B)重量级新成员,带来当前最强的开源中英双语大模型。
在自己的系统上部署大型语言模型可能会出人意料地简单 - 前提是你拥有正确的工具。以下是如何在桌面上使用像Meta的新Code Llama这样的LLM的方法。
人工智能价值对齐(AI alignment)是关涉AI控制与AI安全的重要问题,随着人工智能的飞速发展和广泛应用,人工智能可能带来的风险和挑战也日益凸显,由此,“价值对齐”问题开始被广泛讨论和提及。
复旦大学马剑鹏教授领衔的科研团队开发的新型计算方法OPUS-DSD,不但能够成功地解析冷冻电子显微镜(Cryo-EM)结构解析技术中因传统方法无法分辨而缺损的生物大分子结构,并且高效精准地分辨出柔性结构域在受测样品中的构象分布。
研究人员已经找到了解决数字图像准确性和美观性之间基本权衡的方法
GPT-4V风头正盛,LLaVA-1.5就来踢馆了!它不仅在11个基准测试上都实现了SOTA,而且13B模型的训练,只用8个A100就可以在1天内完成。
在大语言模型内部,是否有一个世界模型?LLM是否具有空间感?并且在多个时空尺度上都是如此? 最近,MIT的几位研究者发现,答案是肯定的!
悄无声息,羊驼家族“最强版”来了! 与GPT-4持平,上下文长度达3.2万token的LLaMA 2 Long,正式登场。
矩阵乘法已经成为机器学习模型的构建模块,是各种强大 AI 技术的基础,了解其执行方式必然有助于我们更深入地理解这个 AI 以及这个日趋智能化的世界。
艾瑞发布《AIGC系列报告——中国AIGC产业全景报告》,作为AIGC系列首发,报告将展开对AIGC产业的全景洞察、探究生成式AI技术对数字产业的影响变化
有效的压缩就是要找到模式,在不丢失信息的情况下将数据变小。当一种算法或模型能准确猜出序列中的下一条数据时,就表明它善于发现这些模式。
基于扩散原理的模型已经成为生成式图像AI的主流。Max Tegmark团队新提出的基于于带电粒子分布过程的模型,可能会带来更优的效果。而随着更多物理模型在生成式AI中被深度挖掘,某种隐藏的统一性正在渐渐浮现。
在科技巨头强劲推动、创业者快速拥抱以及大企业的积极引入下,AI Agent彻底火爆了。并且与之前LLM缺乏落地的境况不同,这次AI Agent再也不是纸上谈兵,目前已经有很多公司推出了Agent项目及相关产品。
美国国立卫生研究院的一项研究显示,人工智能(AI)和机器学习(ML)在检测和诊断多囊卵巢综合症(PCOS)方面显示出很高的功效。
阿里目前再次开源全新的Qwen-14B的模型,参数规模142亿,但是它的理解能力接近700亿参数规模的LLaMA2-70B,数学推理能力超过GPT-3.5。
昨天,Baichuan2-53B正式发布!首次开放API,意味着百川大模型开始正式进军商用了。另外,模型的数学和逻辑推理能力都大幅飙升,对于幻觉的处理,已经在国内遥遥领先。
为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。
OpenAI刚刚连发4条推特,宣布了ChatGPT的重磅更新。ChatGPT支持多模态,目前已经支持语音的输入、语音的输出、理解图片的输入!不过目前似乎仅限于客户端~官方说的是未来2周内企业和Plus用户可以使用,后面会普及到其它用户!
在18 项不同的任务中,使用ChatGPT-4 的咨询顾问平均多完成了 12.2% 的任务,完成任务的速度提高了 25.1%,成果质量提高了 40%。这项突破性的前沿研究表明,人工智能将在未来几年对职业工作产生巨大影响。研究者称,明年至少会有两家公司推出比 GPT-4 更强大的AI。
OpenAI作图神器DALL·E 3内测开启,网友纷纷上手实测后,感慨强到令人发指。文生图从此告别「提示词时代」?
“新·AI绘画细节控制大师”ControlNet-XS来啦!参数只要原始ControlNet的1%。 就能做到蛋糕口味随意切换
上海交大生成式人工智能研究组 (GAIR) 积极攻克难关,研发并开源了数学计算大模型 “阿贝尔(Abel)”,在多个榜单上取得开源第一!是首个海内外高校团队推出的 SOTA 数学开源大模型。
为了解决AutoGPT一旦运行起来就不受控制的痛点,并且调优 LLM Agent 的过程更简单更系统化,波形智能联合苏黎世联邦理工大学和浙江大学,开发了名为 Agents 的开源智能体框架。
AI生成比人类动手写画所排放的二氧化碳可少三个数量级!结论来自LeCun最新分享“非常因吹斯汀”的一篇论文:
FoleyGen利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。
人工智能(AI)正在以前所未有的方式塑造科学领域。从加速研究过程到提出新的研究假设,AI 的加入为科学带来了巨大的潜力。
麻省理工学院计算机科学与人工智能实验室(CSAIL)研究团队发现,多个语言模型协同工作胜过单一模型,多个AI协作有助于提高大型语言模型的推理能力和事实准确性。
谷歌DeepMind的研究人员最近开发了一种技术,通过使用其他人工智能模型来改进提示词,进而提高 ChatGPT 等人工智能语言模型的数学能力