南大周志华:百万模型进入学件基座系统,很多我们没预期过的事也有可能实现
南大周志华:百万模型进入学件基座系统,很多我们没预期过的事也有可能实现大模型时代,全世界AI从业者追赶OpenAI GPT系列的脚步仍未停歇,但也有人,坚持深耕在国产原创的另一条大模型之路上。
搜索
大模型时代,全世界AI从业者追赶OpenAI GPT系列的脚步仍未停歇,但也有人,坚持深耕在国产原创的另一条大模型之路上。
这几天,打开社交媒体平台,很多人正在热烈讨论一个叫做「AI 模特」的玩法。 点开几个 Demo,确实惊艳。下方视频是一位海外网友自制的穿搭合辑,你能分得清这是 AI 还是真人吗?
前几天,OpenAI 已经完成了 12 连更的最后一更 —— 如外界所料,是新的推理系列模型 o3 和 o3-mini 。
雷军再次出手,以千万级薪酬招揽DeepSeek核心研究员、95后AI天才罗福莉。这位曾在国际顶会一次性发表8篇论文的技术大牛,有望领军小米AI大模型团队。
要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。 不过在网友们纷纷测试之际,有个bug也成了热议的焦点—— 只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。
好家伙!1750亿参数的GPT-3只需20MB存储空间了?! 基于1.58-bit训练,在不损失精度的情况下,大幅节省算力(↓97%)和存储(↓90%)。
本文介绍了一套针对于低比特量化的 scaling laws。
最近,LAION AI 的创始人 Christoph Schuhmann 分享了一个有趣的发现,他指出,文本向量模型似乎存在一个问题:即使句子词序被打乱,模型输出的向量与原句仍然高度相似。
近期NexusTrade的创始人Austin Starks撰文介绍了他使用OpenAI o1模型构建投资组合的一些经验。并展示如何使用OpenAI o1彻底改变金融市场的研究、分析和交易方式。
今天和大家分享一个我最近搞定的小工具,简单来说,它可以一句话生成一个完整的网页应用,成本低到不可思议——一毛钱就能实现一句话生成应用,甚至配合之前文章提到过的 open router[1] 上的开源 Google 的 Gemini2.0 免费大模型,完全 0 成本!