大模型进入 RL 下半场。前段时间,OpenAI Agent Reseacher 姚顺雨的博客文章《The second half》掀起热议,从「模型算法」到「实际效用」,如何重新定义问题和设计真实用例的 evaluation 变得尤为重要。 从评测基准到实际应用效果,现有的评估体系怎样有效衡量 Agent 产品的 ROI?对于创企、希望应用 AI 的企业...
AI正在深刻改变产品传统的开发方式,这个进度远超你想象。 此前,YC管理合伙人贾里德·弗里德曼透露:W25中,1/4的创业公司,用AI生成代码库。 随着越来越多AI编程工具的崛起,AI已经不仅仅是开发者编写代码的工具,甚至成为软件构建的基础设施。 不久前,a16z就发布了一篇文章关于AI变革软件开发模式的文章。文章里探讨了9种新兴的开发模式,这些模式很好地...
作者|沐风 来源|AI先锋官 以前想要训练万亿参数的大模型,都需要用到英伟达的GPU。 现在,有可能可以跟它说Bye Bye了。 近日,华为盘古团队(包含诺亚方舟实验室、华为云等)在arxiv网站上,发布了一份在昇腾 NPU上高效训练大型稀疏混合专家模型(MoE)的技术报告。 报告显示,盘古研究团队在6000+块昇腾NPU集群上,完成了7180亿(718B...
研究背景 机器学习模型在诸多领域已经取得了显著的成功,例如图像识别、自然语言处理和自动驾驶等。然而,许多机器学习算法依赖于一个限制性极强的假设,即训练数据和测试数据的分布是相似的。 这一假设在现实场景中往往难以成立,例如由于环境变化、传感器差异或数据采集条件的不同,测试数据分布可能与训练数据分布存在显著差异,导致模型性能下降。 测试时适应方法(Test-...
多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。 尽管近期强化学习(RL)在传统视觉任务和多模态推理任务中取得了显著进展,但其在奖励建模中的应用仍然受到挑战,尤其是如何通过强化学习对奖励模型引入长期...
从一张照片重建出逼真的带纹理的人体 3D 模型一直是计算机视觉领域的难题。港科广团队提出的 MultiGO 创新方案,通过分层建模思路破解了这一挑战——将人体分解为不同精度层级,从基础体型到衣物褶皱逐级细化。 该方法类似乐高积木的搭建逻辑:先用大模块构建整体轮廓,再用小零件补充细节,最后用微型颗粒表现材质纹理。其核心技术在于采用高斯溅射点作为三维基元,这些...
编辑部 整理自 凹非寺 量子位 | 公众号 QbitAI 未来物理世界要实现AGI,一定是通过端侧智能。 面壁智能CEO兼联合创始人李大海在第三届中国AIGC产业大会上分享了他们的经验认知。 作为当前端侧智能的领跑者,面壁智能在过去一段时间以来可谓是进展频频。 他们发布了端侧模型MiniCPM驱动的面壁小钢炮超级助手cpmGO,MiniCPM也逐步开拓...
图片来源:Unsplash OpenAI 为日本、印度、新加坡和韩国的 ChatGPT 企业版、ChatGPT 教育版及 API 用户推出了数据驻留选项。 此举允许符合条件的客户将数据存储在这些国家境内,助力企业遵守当地数据主权法规。 API 用户可通过创建新项目并选择首选区域启用该功能,而 ChatGPT 企业版和教育版客户则可设置工作区,实现包括用...
任何技术产品都有攻击面,大模型也在所难免。模型产品和攻击方式永远是「道」与「魔」的此消彼长。 比如去年就有份论文提出一个新的攻击方法,成功盗取了其他用户发送给大模型的字段。此漏洞利用了 KV 缓存共享——一项大语言模型 (LLM) 业界广泛应用,两大主流推理框架 SGLang 和 vLLM 都在使用的技术。 LLM 的安全问题不容小觑。无论对于用户还是企业,...
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI Meta FAIR新负责人上任,联合创始人回归: Rob Fergus,早年间与LeCun等共同创立FAIR,之后在DeepMind领导纽约团队。 今年4月他已回到Meta,在GenAI部门帮助提升Llama的记忆和个性化能力。 这一次他接替离职的前一任负责人Joelle Pineau,当时外界猜测Me...