整理|冬梅 GitHub 回应“封禁”中国 IP: 只是技术 Bug 昨晚,一则“GitHub 封锁中国 IP”的消息在技术圈内引发热议。 事情的起因是,有用户日常访问 GitHub 时发现已经被其拒之门外,也就是说中国 IP 登录 GitHub,很可能会遇到下面的情况: 已登录用户(建立了有效会话)或通过 SSH 连接的用户暂时仍能正常访 但未登录状...
新智元报道 编辑:犀牛 定慧 【新智元导读】研究发现,推理模型(如DeepSeek-R1、o1)遇到「缺失前提」(MiP)的问题时,这些模型往往表现失常:回答长度激增、计算资源浪费。本文基于马里兰大学和利哈伊大学的最新研究,深入剖析推理模型在MiP问题上的「过度思考」现象,揭示其背后的行为模式,带你一窥当前AI推理能力的真实边界。 推理模型越来越成...
©来源 | 机器之心 在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。 近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710 亿(371B)tokens,覆盖网页、代码和高质量合成数据三大领域。 报告标题: MegaMath: Pushing the Limits of Ope...
OpenAI 刚刚上线了一项重要更新——API 组织验证(Verified Organization)。直接关系到你未来能否用上 OpenAI 最顶尖的 AI 模型和新功能 接下来一周OpenAI将发布一系列新模型,Sam Altman 也已经官宣,如果不进行API验证,新模型可能无法通过API使用 OpenAI 立场:总有那么一小撮人试图利用 AP...
机器之心报道 编辑:Panda 今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。 他写到:「众所周知,推理模型通常会生成较长的响应,这会增加计算成本。现在,这篇新论文表明,这种行为源于强化学习的训练过程,而并非更高的准确度实际需要更长...
本文第一作者为邓慧琳,中国科学技术大学硕博连读四年级,研究方向为多模态模型视觉理解、推理增强(R1强化学习)、异常检测。在TAI、TASE、ICCV等期刊和顶会发表论文。 近年来,随着大型语言模型(LLMs)的快速发展,多模态理解领域取得了前所未有的进步。像 OpenAI、InternVL 和 Qwen-VL 系列这样的最先进的视觉-语言模型(VLMs),...
赵俭,北京邮电大学本科三年级,研究方向为大语言模型。刘润泽,清华大学硕士二年级,师从李秀教授,研究方向为大语言模型与强化学习,特别关注大模型推理能力增强与测试时间扩展,在 NeurIPS、ICML、ICLR、AAAI 等顶级学术会议发表多篇论文,个人主页:ryanliu112.github.io。 随着 OpenAI o1 和 DeepSeek R1 的爆...
新智元报道 编辑:Aeneas KingHZ 【新智元导读】AI辅助人类,完成了首个非平凡研究数学证明,破解了50年未解的数学难题!在南大校友的研究中,这个难题中q=3的情况,由o3-mini-high给出了精确解。 就在刚刚,AI完成了首个非平凡研究数学证明! 完成这项研究的,是美国纽约布鲁克海文国家实验室凝聚态物理与材料科学分部的一位华人学者W...
机器之心发布 机器之心编辑部 从 ChatGPT 引发认知革命到 GPT-4o 实现多模态跨越,AI 技术的每次跃迁都在印证一个底层逻辑 —— 数据质量决定智能高度。而今,这场 AI 浪潮正在反哺数据库领域,推动其从幕后走向台前,完成智能时代的华丽转身。 在 DB+AI 的舞台上,作为分布式数据库的领军者, OceanBase 正凭其一体化架构重新定义 AI...
金磊 发自 上海 量子位 | 公众号 QbitAI 来自国内的光电混合芯片技术,登上最新顶刊Nature! 这次的成果主要聚焦在了自主研发的光子计算处理器——PACE(Photonic Arithmetic Computing Engine)。 简单来说,PACE是一种基于光电混合的架构,它通过光执行矩阵向量乘法,可以实现超低延迟和高能效的计算。 根据论文...