本文提出 LUFFY 强化学习方法,一种结合离线专家示范与在线强化学习的推理训练范式,打破了“模仿学习只学不练、强化学习只练不学”的传统壁垒。 论文标题: Learning to Reason under Off-policy Guidance 论文地址: https://arxiv.org/abs/2504.14945 Huggingface 地址: ...
随着人工智能技术的飞速发展,机器人在各种场景中的应用越来越广泛。然而,机器人在真实世界中的操作能力仍然受到诸多限制,其中一个关键问题是缺乏高质量的可交互物体数据。 一、项目概述 Infinite Mobility 是上海 AI Lab 推出的可交互物体生成模型,基于程序化生成技术,能够高效生成高质量的可交互物体数据资产。该模型支持 22 类常见可交互物...
你的 GPT-4o 变得更加谄媚了吗? 在最近的一次更新中,GPT-4o 翻车了。 翻车程度是空前的,以至于 OpenAI CEO Sam Altman 昨天亲自发文澄清: “最近几次对 GPT-4o 的更新,让它的个性变得有些过于谄媚、甚至有点招人烦了(虽然也有一些不错的改进)。我们正在加紧修复,有些问题会在今天内解决,剩下的将在本周内陆续修复。” ...
今天是2025年4月28日,星期日,北京,晴。 我们来看看Deepresearch与RAG相关进展,重点看看起实现思路。 另一个,看看DeepSeek-R1的一个有趣的实验模型,思路还不错。 抓住根本问题,做根因,专题化,体系化,会有更多深度思考。大家一起加油 一、Deepresearch与RAG相关进展回顾 1、Deepresearch与github进展 ...
在这个时点上,大模型团队如何确定自己的发展主线,不只是个技术问题,更是对不同产品路线和商业判断的策略问题。 文| 邓咏仪** 编辑 | 苏建勋 4月28日,AI圈子内的从业者们都在等待一件事:Qwen 3。 从中午开始,Qwen 3即将发布的小道消息,已经满天飞舞。Qwen团队负责人林俊旸也在X上暗示:“看看我们今晚能否完成Qwen 3的...
TIPS 1、下载 IT桔子 APP,实时跟踪国内外一级市场投融资事件。 2、转载请注明来源自 IT 桔子(itjuzi521),侵权必究。 3、建立“投资速递”长期发布合作,请发邮件到 hello@itjuzi.com。 2025 年 4 月 28 日 IT 桔子(itjuzi521) 收录 14 起投资/IPO排队事件 耀速科技获数千万元战略融资。本轮融...
文| 吕虹 近日,上海应用技术大学应用型人才培养改革推进大会上,宇树科技创始人王兴兴等知名企业负责人,成为第一届应用型学科专业设置委员会委员。除王兴兴外,上海集成电路研发中心、上海化工研究院、上海港机重工有限公司、上海百雀羚日用化学有限公司等企业高管身影也活跃其中。 据上海应用技术大学相关负责人表示,这些资深行业企业专家将深度参与学校的专业设置、课程开发设...
文| 严兆鑫 4月28日,南都湾财社记者从人形机器人企业帕西尼感知科技(下称“帕西尼”)方面获悉,其近日获得比亚迪数亿元的战略投资。工商信息显示,比亚迪成为帕西尼最大外部股东,持股约13.37%。 据悉,这是帕西尼第A++轮融资,也是比亚迪目前在具身智能领域最大的单笔投资。本轮融资将用于帕西尼在多维触觉传感技术及人形机器人产品矩阵的研发与量产推进。 帕西...
**关注我,记得标星⭐️不迷路哦~ ✨ 1: qwen3 Qwen3是阿里云发布的最新通义千问大模型,提供多种尺寸和专家模型,具备优秀推理、对话和工具使用能力。 Qwen3 是由阿里云 Qwen 团队开发的大型语言模型系列。它是 Qwen 系列的最新成员,代表了该团队迄今为止最先进、最智能的系统,吸取了构建 QwQ 和 Qwen2.5 的经验。Qwen3...