安爸 - 安爸-超级家庭

AI信息差 2025-05-09

下周聊：大模型进入 RL 下半场，模型评估为什么重要？

大模型进入 RL 下半场。前段时间，OpenAI Agent Reseacher 姚顺雨的博客文章《The second half》掀起热议，从「模型算法」到「实际效用」，如何重新定义问题和设计真实用例的 evaluation 变得尤为重...

安爸

19 0

AI信息差 2025-05-09

a16z最新分享：AI时代的9大新兴开发模式

AI正在深刻改变产品传统的开发方式，这个进度远超你想象。此前，YC管理合伙人贾里德·弗里德曼透露：W25中，1/4的创业公司，用AI生成代码库。随着越来越多AI编程工具的崛起，AI已经不仅仅是开发者编写代码的工具，甚至成为软件构建的基...

安爸

17 0

AI信息差 2025-05-09

告别英伟达？华为昇腾NPU跑出准万亿参数大模型，媲美DeepSeek R1

作者｜沐风来源｜AI先锋官以前想要训练万亿参数的大模型，都需要用到英伟达的GPU。现在，有可能可以跟它说Bye Bye了。近日，华为盘古团队（包含诺亚方舟实验室、华为云等）在arxiv网站上，发布了一份在昇腾 NPU上高效训练大型...

安爸

20 0

AI信息差 2025-05-09

模型崩溃自救指南：5行代码实现TTA鲁棒性飞跃，天大×腾讯开源COME方案

研究背景机器学习模型在诸多领域已经取得了显著的成功，例如图像识别、自然语言处理和自动驾驶等。然而，许多机器学习算法依赖于一个限制性极强的假设，即训练数据和测试数据的分布是相似的。这一假设在现实场景中往往难以成立，例如由于环境变化、传...

安爸

22 0

AI信息差 2025-05-09

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用，在训练阶段可以提供稳定的 reward，评估阶段可以选择更好的 sample 结果，甚至单独作为 evaluator。尽管近期强化学习（RL）在传...

安爸

18 0

AI信息差 2025-05-09

CVPR 2025 单图生成3D人体：港科广团队提出分层高斯建模框架MultiGO

从一张照片重建出逼真的带纹理的人体 3D 模型一直是计算机视觉领域的难题。港科广团队提出的 MultiGO 创新方案，通过分层建模思路破解了这一挑战——将人体分解为不同精度层级，从基础体型到衣物褶皱逐级细化。该方法类似乐高积木的搭建逻辑...

安爸

17 0

AI信息差 2025-05-09

面壁CEO李大海：物理世界要实现AGI，一定是通过端侧智能中国AIGC产业峰会

编辑部整理自凹非寺量子位 | 公众号 QbitAI 未来物理世界要实现AGI，一定是通过端侧智能。面壁智能CEO兼联合创始人李大海在第三届中国AIGC产业大会上分享了他们的经验认知。作为当前端侧智能的领跑者，面壁智能在过去一...

安爸

17 0

AI信息差 2025-05-09

速递｜OpenAI亚洲合规新动作：OpenAI定制化数据驻留服务覆盖日印新韩

图片来源：Unsplash OpenAI 为日本、印度、新加坡和韩国的 ChatGPT 企业版、ChatGPT 教育版及 API 用户推出了数据驻留选项。此举允许符合条件的客户将数据存储在这些国家境内，助力企业遵守当地数据主权法规。...

安爸

17 0

AI信息差 2025-05-09

从手机、PC 到汽车，不泄密的 AI 才是时代需要的 AI

任何技术产品都有攻击面，大模型也在所难免。模型产品和攻击方式永远是「道」与「魔」的此消彼长。比如去年就有份论文提出一个新的攻击方法，成功盗取了其他用户发送给大模型的字段。此漏洞利用了 KV 缓存共享——一项大语言模型 (LLM) 业界广泛...

安爸

17 0

AI信息差 2025-05-09

顶尖科学家Rob Fergus重掌FAIR，15万引用学者回归Meta，战略转向AGI

梦晨发自凹非寺量子位 | 公众号 QbitAI Meta FAIR新负责人上任，联合创始人回归： Rob Fergus，早年间与LeCun等共同创立FAIR，之后在DeepMind领导纽约团队。今年4月他已回到Meta，在GenAI...

安爸

21 0

安爸 的文章

安爸的文章