微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B动辄百亿、千亿参数的大模型正在一路狂奔,但「小而美」的模型也在闪闪发光。
动辄百亿、千亿参数的大模型正在一路狂奔,但「小而美」的模型也在闪闪发光。
斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorch Eager基线,但GPU编程加速自动化的按钮,已经被按下!
第四天,DeepSee发布包括三个主要项目: DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法,实现计算和通信完全重叠; EPLB(Expert Parallelism Load Balancer) - 专为 V3/R1 设计的专家并行负载均衡器; Profile-data- 分析 V3/R1 中计算与通信重叠的性能数据集。
零基础逆袭!2年靠AI自学编程打造3款千万级APP,揭秘TikTok流量红利+9.9美金订阅制,如何用百元营销撬动百万利润?
按时整活!DeepSeek开源周第四天,直接痛快「1日3连发」,且全都围绕一个主题:优化并行策略。
昨天,Claude 3.7 Sonnet 正式发布。根据目前的各项测评,这个模型可以说是全宇宙最好的代码生成模型,超越了 DeepSeek R1 和 OpenAI 的 o3 等模型。如果你是程序员,一定要第一时间切换过去,用下这款模型。
即日起,北京时间每日00:30-08:30为错峰时段,API 调用价格大幅下调:DeepSeek-V3 降至原价的50%,DeepSeek-R1降至25%,在该时段调用享受更经济更流畅的服务体验。具体价格参看图2.
Claude 3.7 Sonnet制作的游戏中,贪吃蛇居然惊现自我意识,甚至经历了一场存在主义危机!它开始思考:我是谁?我在这里做什么?网友们大受震撼:要是游戏里有这样的NPC,那就绝了。
当AI开始普及时,什么行业会最先受到影响?这个问题在过去曾经引起过不少争议,不过现在或许已经有了答案:翻译。近日,腾讯宣布将关停旗下的腾讯翻译君业务,包括app、在线网站和小程序都将在3月13日11:00正式关停,后续不再提供任何在线服务,并将删除所有用户的个人信息。
目前的 AI 行业,除了大模型外,竞争最激烈的可能就是 AI 编程了。昨天的文章《用 AI 解决专利纠纷半年 ARR 增 20 倍,Anthropic 再融 35 亿美金》里我还调侃 AI 编程正在经历百编大战,没想到今天这个行业又来了一些新消息。