在最近的一次采访中,OpenAI CEO Sam Altman 透露,ChatGPT 的周活跃用户数已突破 4 亿。他表示,全球约 10% 的人口在使用 OpenAI 的产品,这也意味着用户总数接近 8 亿。 然而,亮眼成绩单背后却是难掩的焦虑。这种「不安全感」最直观的体现是,随着今年 AI 竞争日趋白热化,Sam Altman 在 X 平台发文宣传的频率也...
作者 | Craig Risi 译者 | 刘雅梦 策划 | 丁晓昀 GitHub Copilot 集成到 Windows 终端 Canary 中了,推出了一项名为“终端聊天”(Terminal Chat)的 AI 驱动特性,使用户能够直接在终端环境中获得命令的建议和解释。该集成功能对所有 GitHub Copilot 订阅用户开放,包括个人、商业和企...
新智元报道 编辑:桃子 英智 【新智元导读】刚刚,Gemini 2.5 Pro编程登顶,6美元性价比碾压Claude 3.7 Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。 谷歌,彻底打了一场漂亮的翻身仗。 aider多语言编程基准测试显示,Gemini 2.5 Pro近出世半个多月,编程能力已经是全球...
整理|冬梅 GitHub 回应“封禁”中国 IP: 只是技术 Bug 昨晚,一则“GitHub 封锁中国 IP”的消息在技术圈内引发热议。 事情的起因是,有用户日常访问 GitHub 时发现已经被其拒之门外,也就是说中国 IP 登录 GitHub,很可能会遇到下面的情况: 已登录用户(建立了有效会话)或通过 SSH 连接的用户暂时仍能正常访 但未登录状...
新智元报道 编辑:犀牛 定慧 【新智元导读】研究发现,推理模型(如DeepSeek-R1、o1)遇到「缺失前提」(MiP)的问题时,这些模型往往表现失常:回答长度激增、计算资源浪费。本文基于马里兰大学和利哈伊大学的最新研究,深入剖析推理模型在MiP问题上的「过度思考」现象,揭示其背后的行为模式,带你一窥当前AI推理能力的真实边界。 推理模型越来越成...
©来源 | 机器之心 在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。 近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710 亿(371B)tokens,覆盖网页、代码和高质量合成数据三大领域。 报告标题: MegaMath: Pushing the Limits of Ope...
OpenAI 刚刚上线了一项重要更新——API 组织验证(Verified Organization)。直接关系到你未来能否用上 OpenAI 最顶尖的 AI 模型和新功能 接下来一周OpenAI将发布一系列新模型,Sam Altman 也已经官宣,如果不进行API验证,新模型可能无法通过API使用 OpenAI 立场:总有那么一小撮人试图利用 AP...
机器之心报道 编辑:Panda 今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。 他写到:「众所周知,推理模型通常会生成较长的响应,这会增加计算成本。现在,这篇新论文表明,这种行为源于强化学习的训练过程,而并非更高的准确度实际需要更长...
本文第一作者为邓慧琳,中国科学技术大学硕博连读四年级,研究方向为多模态模型视觉理解、推理增强(R1强化学习)、异常检测。在TAI、TASE、ICCV等期刊和顶会发表论文。 近年来,随着大型语言模型(LLMs)的快速发展,多模态理解领域取得了前所未有的进步。像 OpenAI、InternVL 和 Qwen-VL 系列这样的最先进的视觉-语言模型(VLMs),...
赵俭,北京邮电大学本科三年级,研究方向为大语言模型。刘润泽,清华大学硕士二年级,师从李秀教授,研究方向为大语言模型与强化学习,特别关注大模型推理能力增强与测试时间扩展,在 NeurIPS、ICML、ICLR、AAAI 等顶级学术会议发表多篇论文,个人主页:ryanliu112.github.io。 随着 OpenAI o1 和 DeepSeek R1 的爆...