如果说每年九月是苹果硬件的科技春晚,那么每年夏天的 WWDC,就是苹果软件的年度盛典。 去年 WWDC 的重头戏,无疑是 Apple Intelligence 的亮相: 但转眼一年过去,不仅国区的我们依然没有吃到这块苹果馅的大饼,已上线地区的反馈也难言乐观,传说中的「升级版 Siri 智能体」更是推进乏力。 更何况,当前的 Apple Intellige...
新智元报道 编辑:KingHZ 犀牛 【新智元导读】注意力机制的「平方枷锁」,再次被撬开!一招Fenwick树分段,用掩码矩阵,让注意力焕发对数级效率。更厉害的是,它无缝对接线性注意力家族,Mamba-2、DeltaNet 全员提速,跑分全面开花。长序列处理迈入log时代! LLM苦算力太久了! 为缓解长序列建模中的算力瓶颈,研究界持续探索高效替代...
新智元报道 编辑:KingHZ 【新智元导读】仅用6小时,Claude 4就让研究者了解了如何制造神经毒气——这不是小说情节,而是真实事件。更令人担忧的是,Anthropic自身也无法完全评估风险。这是否意味着这家AI巨头的「安全人设」正在崩塌? 只要6小时,顶尖大模型Claude 4 Opus「安全防线」被攻破! AI安全研究机构FAR.AI联合...
新智元报道 编辑:犀牛 【新智元导读】AI正在颠覆医疗领域!哈佛、斯坦福等顶尖学术医疗中心的研究表明,OpenAI的o1-preview在诊断推理任务中全面超越人类医生。从新英格兰医学杂志的临床病例到真实急诊室场景,o1不仅精准识别疾病,还在关键时刻提供可靠的第二意见。 AI医生的时代正在到来! 哈佛、斯坦福等学术医疗中心的医生发布重磅论文,测试了...
选自quantamagazine 作者: Joseph Howlett 机器之心编译 三百多年前,数学家费马在书页边缘留下了一个看似简单却困扰了学者几个世纪的难题——费马大定理。 1994 年,Andrew Wiles 的实际性证明为这个传奇故事画上了句号。然而,故事并未就此结束。 那场伟大证明的真正遗产,并非仅仅是攻克了一道难题,而是揭示了不同数学世界之间...
本文主要作者是吕昂和谢若冰。吕昂,中国人民大学博士生,研究方向为语言模型结构优化,导师为严睿教授;谢若冰,腾讯高级研究员,研究方向为大语言模型、推荐系统。 最近的一篇论文中,来自人大和腾讯的研究者们的研究表明,语言模型对强化学习中的奖励噪音具有鲁棒性,即使翻转相当一部分的奖励(例如,正确答案得 0 分,错误答案得 1 分),也不会显著影响下游任务的表现。 ...
该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。 大语言模型受限于固定上下文窗口,长期对话中「失忆」、记忆断裂等问题频发,北邮百家 AI 团队重磅推出首个大模型记忆操作系统开源框架 MemoryOS。巧妙融合计算机操作系统原理与人脑分层记忆机制,构建段页式三级存储架构及四大核心模块...
UNITE团队 投稿 量子位 | 公众号 QbitAI 多模态检索是信息理解与获取的关键技术,但其中的跨模态干扰问题一直是一大难题。 可行的解决办法是构建一种统一的多模态表示方式,为此,来自快手与东北大学的研究人员推出了多模态统一嵌入框架——UNITE。 UNITE的核心目标,就是构建一个能同时处理文本、图像、视频及其融合模态输入的统一嵌入器。 它从数据策...
图片来源:Vercel 在私营企业中,就通过销售人工智能创收而言,没有哪家公司能超越OpenAI。但那些向 OpenAI 和其他 AI 开发者提供“数字镐铲“(即 AI 淘金热中的基础设施工具)的初创公司也表现不俗。 最新案例是云服务公司 Vercel,企业通过其开发人工智能及商业应用和网站。据该公司首席运营官 Jeanne DeWitt Grosse...
GCoT团队 投稿 量子位 | 公众号 QbitAI 图神经网络还能更聪明?思维链提示学习来了! 由于图数据拥有复杂的非线性结构和缺少文本信息,语言模型中的思维链(Chain-of-Thought,CoT)提示学习方法难以简单直接地应用于图数据。 基于此,来自新加坡管理大学和中国科学技术大学的研究者们提出了GCoT——首个应用于无文本图数据的类思维链提示学习...