这篇文章深入探讨了大型语言模型(LLM)在后训练阶段如何学会推理。作者分析并比较了Kimi 1.5、Qwen 2.5、DeepSeek R1/Zero、OpenReasoner-Zero、QwQ 32B和Phi-4等顶级推理模型的后训练策略,涵盖监督微调(SFT)、奖励建模(规则基础与学习型)、强化学习(设计选择、目标、算法)和数据策划(来源、质量过滤和控制...
科学家一直在努力揭开动物行为背后的奥秘,但现实世界中的实验往往受到很多限制。比如很难同时精确还原动物的身体、神经系统以及它们与环境的互动。现在,得益于新一代计算模拟技术,研究人员能用虚拟的 “数字生物” 来探索这些复杂问题。DeepMind 最新推出的果蝇全身物理仿真项目(Whole-body physics simulation of fruit fly ...
今天凌晨4点30,OpenAI推出轻量级版本的Deep research功能提高当前的速率限制,以扩大Plus、Team和Pro用户的使用范围。 值得一提的是,从今天开始免费ChatGPT用户可以使用Deep research,并且支持最新的o4-mini模型。 下面「AIGC开放社区」就用免费版为大家展示一下Deep research的免费功能。现在打开...
新智元报道 编辑:英智 KingHZ 【新智元导读】谷歌DeepMind与HHMI Janelia研究所的科学家们,用AI打造了一个栩栩如生的虚拟果蝇模型。这个模型不仅能精准模拟果蝇的飞行与行走,还通过深度强化学习模仿真实果蝇的行为。 一只小小的果蝇是如何在空中优雅地飞舞,或者在地面上灵活地爬行的? 这些看似简单的动作背后,隐藏着复杂的生物机制和神...
在AI硬件故事里,继耳机、眼镜、手机、电脑……被AI化后,AI玩具成为大模型能力突破C端落地困境的新希望。 原因也很好理解,强大的感知和交互能力,让传统玩具市场蹭上了“情绪价值”的热点。 一个原价9.9的仙人掌玩具,再加上AI功能后,转头就能卖200+元,价格暴涨20倍,甚至出货量一度突破2万台。 事实上,像这样的故事还不止一例: 在拼多多旗舰店里,挂件...
文 & 图| 赵唯佳 有“全球最大车展”之称的上海车展,已于4月23日开幕,并持续到5月2日。在10天的展出时间内,来自26个国家和地区的近1000家中外汽车工业相关企业使出浑身解数,展出最新产品,带来最硬核技术,在超36万平方米的展馆里“争奇斗艳”。 创新高的展出面积,是蓬勃发展的中国汽车产业的缩影。如今,中国已经连续16年位居全球汽车产销第一,...
今日,《科创板日报》记者实探首届具身智能运动会,发现宇树科技、松延动力、卓益得、乐聚机器人、越疆机器人等企业已经提前抵达。 作者 | 陈美 国内首届具身智能机器人运动会即将开赛。 在赛事正式开始的前一天,《科创板日报》记者实地探访了比赛现场,发现宇树科技、卓益得、乐聚机器人、越疆机器人等众多明星企业已经提前抵达,正紧锣密鼓地开展机器人测试工作。 其中,卓益...
文| 李玲 “世界知识产权组织报告显示,中国已经成为全球人工智能专利的最大拥有国,在全球的占比达到60%。” 4月24日上午,国家知识产权局局长申长雨出席国新办发布会,就我国人工智能(AI)领域知识产权相关情况回应记者提问。申长雨表示,近年来,国家知识产权局深入推进人工智能领域知识产权制度创新,为技术和产业提供制度供——包括及时修改完善《专利审查指南》,发...
文| 杨柳 近日许多用户发帖称,在微博“AI智搜”功能中输入用户名,AI会爬取公开内容甚至是仅好友可见的私密内容,输出一份类似于“用户画像”的分析总结。 随后,一些出于隐私担忧的微博网民,纷纷发布模板一致的拒绝授权书面声明,试图禁止微博平台将账号上的所有内容用于AI处理活动,包括机器学习、数据分析、自动生成摘要等。 这起事件引发的争议大致可分为两个维度:微...
文丨丁灵波 今天,OpenAI把前段时间爆红的GPT-4o图像生成功能升级了一下,扩大捞金范围。 其最新、最先进的多模态图像生成模型命名为GPT-Image-1,现可通过Images API获取(Responses API也即将支持),开发者和企业能够基于此将OpenAI高质量图像创建功能集成到自己的应用程序和工具中。 API版本与_ChatGP...