考考大模型视频理解能力,中科院人大百川提出新基准合成框架
考考大模型视频理解能力,中科院人大百川提出新基准合成框架测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。
搜索
测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。
今天凌晨,OpenAI前首席科学家Ilya Sutskever向外界透露了他的最新动态。 不要再问Ilya去哪了,他宣布创立了一家名为“安全超级智能”(Safe SuperIntelligence,简称SSI)的新公司。
太震撼了!AI视频老牌选手Runway出手了,深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直接到达了电影级画质,再次震惊全体网友。AI视频已经进入了神仙打架阶段。Sora危了?
麦当劳宣布其与IBM合作进行的得来速人工智能语音点餐技术测试期结束,该技术已在100多家餐厅部署,这些餐厅将在下个月暂停此项服务。麦当劳表示,将会为自动点赞技术寻求新的合作方,潜在的合作伙伴可能包括OpenAI的Whisper/ChatGPT和谷歌的Gemini。
「AI教父」Geoffrey Hinton在最近的采访中表达了自己对AI智能的理解——LLM并不是简单的统计模型,已经具备了理解能力。与此同时,网友翻出了去年12月的「过期」视频,惊奇地发现Hinton早就「叛变」了,竟然对超级AI取代人类的未来表示支持。
曾经的视频生成王者Runway,带着大招鲨~回来了——
深耕科技的早期投资机构蓝驰创投近期将AGI投资观迭代至2.0版本。一些比较亮眼的观点有:未来,软件公司或将消失,GenAI将催生出一大波一人十亿美金初创公司。而且,开源模型的优势也将慢慢褪去,模型应用需要两手抓,还有......
图灵奖得主、深度学习之父Geoffrey Hinton,又有新动向。
AI圈这遍地开花的大好局面,让吃瓜群众们甚是惊喜。
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。