机器之心报道 编辑:Panda 当状态空间模型遇上扩散模型,对世界模型意味着什么? 在这个 AI 技术与应用大爆发的时代,我们最不缺的就是「热词」,从自回归到扩散模型,从注意力机制到状态空间模型,从思维链到推理模型…… 有时候,其中一些热词会聚拢一处,为 AI 世界创造出新的可能性。 今天我们要介绍的这项研究便是如此,集齐了长上下文、状态空间模型(SSM...
「知其然,亦知其所以然。」 这句儒家命题强调,真正的理解不仅在于结果,更在于推理过程。如今,在大型语言模型的后训练阶段,奖励模型承担着桥接模型行为与人类价值的重要职责;但现有模型往往只给出一个分数,却难以解释其依据。缺乏推理的奖励,就如「知其然而不知其所以然」,既难以建立信任,也难以指导更优的学习。 伊利诺伊大学香槟分校的研究团队提出了 RM-R1 框架,...
从科幻走向现实,Agent 不再是只有工程师和大公司才能拥有的技术资产,它正悄然成为每一个普通人工作与生活中的“第二大脑”。 而这一次,AI 不是换一张皮的智能客服,不是封闭死板的任务系统,而是真正能感知、推理、决策、行动的智能体革命。 本文将带你读懂 Agent 的前世今生、技术奇点、商业实践与未来潜力,一文看清这场正在爆发的 AI 智能体风暴。 在我...
新智元报道 编辑:Aeneas 好困 【新智元导读】本想练练手合成点数据,没想到却一不小心干翻了PyTorch专家内核!斯坦福华人团队用纯CUDA-C写出的AI生成内核,瞬间惊艳圈内并登上Hacker News热榜。团队甚至表示:本来不想发这个结果的。 就在刚刚,斯坦福HAI华人大神团队又出惊人神作了。 他们用纯CUDA-C语言编写的快速AI生成内...
AI coding 这条 AI 行业今年的主线,在最近这段时间愈发清晰。 除了上周刷屏的编程新王 Claude Opus 4 ,新版 DeepSeek R1 也把更新重点也放在了代码能力,不久前 OpenAI 还以 30 亿美元收购 AI 编程助手 Windsurf,随后就发布了编程智能体 Codex。 这几天,原 Kimi 产品负责人明超平,在和京东打仗的...
AI记忆机制团队 投稿 量子位 | 公众号 QbitAI 当AI不再只是“即兴发挥”的对话者,而开始拥有“记忆力”——我们该如何重新定义智能? 来自香港中文大学、爱丁堡大学、香港科技大学与华为爱丁堡研究中心的研究团队联合发布了一项关于AI记忆机制的系统性综述,旨在在大模型时代背景下,重新审视并系统化理解智能体的记忆构建与演化路径。 大语言模型(LLMs)正...
明敏 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 好家伙,AI意外生成的内核(kernel),性能比人类专家专门优化过的还要好! 斯坦福最近披露了一组新发现,结果真的太亮眼了。 由AI优化的内核,在常见深度学习操作上,翻倍超越原生PyTorch,性能至多可以提升近400%—— 矩阵乘法(Matmul,FP32):性能达到PyTorch torc...
新智元报道 编辑:英智 【新智元导读】OpenAI的o3推理模型席卷AI界,算力暴增10倍,能力突飞猛进!但专家警告:最多一年,推理模型可能一年内撞上算力资源极限。OpenAI还能否带来惊喜? 最多一年,推理模型就会撞上训练算力的「天花板」。 OpenAI的o3这样的推理模型,诞生还不到一年,能力已经突飞猛进。OpenAI的研究人员非常乐观地认为,...
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 陶哲轩转发,AI搞数学证明的标准习题集来了! DeepMind最新开源形式化数学猜想库—— 猜想库收录了经典的形式化表述的数学猜想集合,例如,解析数论中的四个朗道问题。 不仅如此,资源库中还提供了各种代码函数,以方便用户对自然语言的数学猜想进行形式化的表述。 陶哲轩曾用Lean形式化证明了PFR猜想(多...
通义实验室 投稿 量子位 | 公众号 QbitAI 为提升大模型“推理+搜索”能力,阿里通义实验室出手了。 最新研究开源全新通用预训练框架——MaskSearch,在域内及跨域开放域问答任务上均较基线方法取得显著性能提升。 小模型甚至能媲美大模型表现。 在推理+搜索方向,通义实验室搜索团队已提出ZeroSearch、OmniSearch等工作,通过在特定的...