首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为
首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为让GPT-4操纵人形机器人,事先不做任何编程or训练,能搞成啥样儿? 答案是:太 猎 奇 了!
搜索
让GPT-4操纵人形机器人,事先不做任何编程or训练,能搞成啥样儿? 答案是:太 猎 奇 了!
ChatGPT近期偷懒严重,有了一种听起来很离谱的解释:模仿人类,自己给自己放寒假了~
Transformer作者创立的大模型公司,再获5650万美元投资,换算成人民币有四亿多。
教大模型调用工具,已经是AI圈关注度最高的话题之一了。这不,又有一项研究登上最新NeurIPS 2023——它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。
开源模型正展现着它们蓬勃的生命力,不仅数量激增,性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹:「开源人工智能模型正走在超越专有模型的路上。
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。
本文介绍了一个名为Alph-CLIP的框架,它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后,Alpha-CLIP可以在保证CLIP原始感知能力的前提下,关注到任意指定区域。通过替换原始CLIP的应用场景,Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。
最近,来自南大等机构的研究人员开发了一个通用的框架,用一段音频就能让照片上的头像讲多国语言。不论是头部动作还是嘴型都非常自然,看到很多不错的
最近,一张美国科技大厂的薪酬表曝出,OpenAI以500万起薪领衔。初创公司给出的薪酬,竟然超过了所有大型科技公司。不过初级码农,时薪却低至85元。
在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
随着大型语言模型(LLM)的发展,从业者面临更多挑战。如何避免 LLM 产生有害回复?如何快速删除训练数据中的版权保护内容?如何减少 LLM 幻觉(hallucinations,即错误事实)? 如何在数据政策更改后快速迭代 LLM?这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下,对于 LLM 的安全可信部署至关重要。
计算芯片未来可能不是英伟达的专利,AMD也要来了。
人类对人工智能学的潜心钻研终于再度获得重大突破,大模型的涌现能力与AIGC的应用普及为那不一定是AGI但一定更AI的未来提供了确定性的加速度。AI2.0时代的加速到来,不仅是把AI能力融入到现有应用中,更是未来产业范式的再塑造。AI正跳跃式地加速渗透进各行各业,推动一场新的生产力与创造力革命。
喂给大模型语料——最初是维基百科和Reddit,后来扩展到音频、视觉图像甚至雷达和热图像——后者广义上说是换了种表达方式的语言。也因此有生成式AI的创业者认为,一个极度聪明的大语言模型就是那个通往AGI最终答案,多模态的研究道路只是目前对前者的底气不足。
在 AI 取代人类的危机之下,一个程序员的焦虑治愈之路。
AI遥感应用企业LiveEO完成1000万美元融资,由绿色科技风险投资Greencode Ventures领投。本轮融资将促进公司开发森林砍伐监测解决方案,加速进入欧盟森林砍伐法规(EUDR)合规和森林砍伐监测市场。
21世纪是否是“生命科学的世纪”还是未知,但一定是AI大模型的世纪。 互联网头部企业纷纷发布大模型,产品呈全面开花之势;字节跳动创始人张一鸣公开表示字节跳动无法错过AIGC,挑灯夜读OpenAI的论文,并在卸任CEO两年后在香港成立个人投资基金Cool River Venture
蚂蚁集团20篇论文入选AI顶会NeurlPS,7成论文聚焦生成式AI。
幂律智能已经获得近百家互联网、制造业、连锁零售、金融、医疗等行业头部客户的认可,公司业务较去年增长超200%。
时值年末,正是各类年度总结任务集中涌来之时,也催热了AI代写业务。相比千字60元-80元的人工写作价格,AI代写只要不到30元的价格,就能“一键生成”年终总结报告。记录显示,有的店铺2小时就卖出了上百份产品,有的店铺月销量达6万单以上。
进入多模态时代,大模型也会操纵无人机了!只要视觉模块捕捉到启动条件,大模型这个“大脑”就会生成动作指令,接着无人机便能迅速准确地执行。
由真实人脑细胞构建的“迷你大脑”和微电极组成的AI系统,已经能够进行语音识别——从数百个声音片段中准确认出某个特定人的声音的那种。
大模型创业,“最安全”的人来了!吴翰清,前阿里云首席安全科学家、P10级研究员在今年5月离职阿里后,现在被曝投身AI创业。
一条神秘磁力链接引爆整个AI圈,现在,正式测评结果终于来了:首个开源MoE大模型Mixtral 8x7B,已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。
Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。
UCLA等机构研发的Chameleon框架,在AI界引起广泛关注,获得超过100次学术引用,AlphaSignal评选其为「周最佳论文」。
NeurIPS 2023杰出论文正式公布了!今年共有6篇获奖论文,斯坦福谷歌摘得「杰出论文」桂冠。此外,Ilya Sutskever、Jeff Dean团队十年前的word2vec论文获得了「时间检验奖」,可谓实至名归。
今天,李飞飞携斯坦福联袂谷歌,用Transformer生成了逼真视频,效果媲美Gen-2比肩Pika。2023年俨然已成AI视频元年!
ChatGPT 爆火一年,大模型的竞争走到哪一步了?从微信指数的数据,可以管中窥豹到各家大模型的感知度,ChatGPT 遥遥领先,依然是国内大模型们追赶的对象。