安爸-超级家庭
bg

AI信息差

ICLR 2025 告别Token丢弃:更适合CoT和多轮对话的长文本推理加速方法

近年来,大语言模型(LLMs)展现了在文档问答、长对话、复杂指令遵循等场景下的强大能力。然而,随着上下文长度的增长,一个关键的瓶颈日益凸显——KV Cache(键值缓存)带来的巨大 GPU 显存开销。 为了缓解这一问题,现有方法通常基于注意力稀疏性假设,在推理过程中丢弃(discard)它们认为不重要的 KV Cache。但这带来了一个新的困境:注意力分数...

阅读:10 评论:0

GUI智能体“大脑”升级!浙大&港理工等提出InfiGUI-R1,用强化学习实现深度推理

当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。 然而,一些现有智能体更类似于“反应式行动者”(Reactive Actors),主要依赖隐式推理,面对需要复杂规划和错误恢复的任务时常常力不从心。我们认为,要真正提升 GUI 智能体的能力,关键在于从“反应式”迈向“深思熟虑的推理者”(Deliberative ...

阅读:8 评论:0

文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”

港中文MMLab团队 投稿 量子位 | 公众号 QbitAI “先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。 近日,港中文MMLab团队发布了第一个基于强化学习的推理增强文生图模型:T2I-R1。 △ 文生图进入R1时刻:港中文MMLab发布T2I-R1 大家都知道,OpenAI o1和DeepSeek-R1这类的大语言...

阅读:8 评论:0

100万美元图灵奖奖金,强化学习师徒想献给科研自由

新智元报道 编辑:LRS 【新智元导读】80年代,当强化学习被冷落,这对师徒没有放弃;如今,重看来时路,他们给出的建议仍然是,「坚持」住自己的科研思想。 3月5日,计算机学会(ACM)宣布Andrew Barto和Richard Sutton获得图灵奖,以表彰其在强化学习领域做出的奠基性贡献。 自从9年前AlphaGo围棋大胜,引爆全民RL狂欢,再...

阅读:11 评论:0

天文预测新SOTA!紫东太初&国家天文台联手攻克恒星耀发难题

FLARE团队 投稿 量子位 | 公众号 QbitAI 还记得刘慈欣在《全频带阻塞干扰》中描绘的耀斑爆发吗? 现在科幻照进现实,人类踏出了理解耀斑的重要一步——预测。 来自紫东太初和中国科学院国家天文台的研究团队,联合开发了天文耀发预测大模型FLARE (Forecasting Light-curve-based Astronomical Records ...

阅读:9 评论:0

氛围编程成新晋顶流,腾讯也出手了!代码助手 CodeBuddy 重磅升级,网友实测:真香

作者 | 凌敏 氛围编程(Vibe Coding)彻底火了,甚至已经成为硅谷近期最火热的概念。 今年 2 月,OpenAI 联合创始人、前特斯拉 AI 负责人 Andrej Karpathy 提出氛围编程概念:你完全沉浸在氛围里,拥抱指数式增长,甚至忘记代码本身的存在。“我只是看到什么就说什么,运行,复制粘贴,然后基本能跑起来。如果发生错误,就把错误信息再...

阅读:8 评论:0

客户不转化、内容不合规?AI 与 Agent 如何破解金融营销五大难题

作者|徐小磊,广发银行信用卡中心商业智能负责人 编辑|Kimmy 在金融营销进入智能化 3.0 时代的当下,AI 与 Agent 已不再是锦上添花的“选配”,而是重塑客户洞察、决策效率和服务体验的核心驱动力。本文将结合行业演进、现实痛点与前沿实践,探讨 AI 技术如何为金融机构打造差异化竞争力,开启以“智能密度”为核心的新一轮营销升级。 在将于 2...

阅读:10 评论:0

从“铁三角”到“六有”组织,北银金科如何打造千人高密度数智化团队? 极客时间企业版

当前,银行业正经历一场由数字化、智能化技术驱动的深刻变革。在这一过程中,金融科技子公司作为技术创新的引擎,通过推动技术落地、业务重构和人才培养,正在重塑银行业的服务模式与竞争格局。 在极客时间主办的 2025 DTDS 全球数智人才发展大会上,北银金科党委书记,副总经理赵瑞兰发表了题为《北银金科数智化时代的人才培养与组织变革共生之道》的演讲,介绍了北银金科...

阅读:8 评论:0

Manus放开注册了,智能体元年AI应用何以变现?

目前,Manus新注册用户每天可免费获得300积分,并额外一次性获得1000积分。 作者 | 张真 曾经“一码难求”的AI智能体平台Manus于近日全面开放注册。根据官方公告,新注册用户每天可免费获得300积分,并额外一次性获得1000积分。此前,Manus的邀请码在二手市场一度被炒到10万元。 所谓的积分即用于执行任务的“货币”,Manus收到用户指令后...

阅读:8 评论:0

大模型评估排障指南 | 关于可复现性

这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章: 关于推理 关于 公式解析 关于可复现性 假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发现根本没法复现,这是为什么? 让我们来探讨一下原因。 代码库不同 要想复现论文或报告的评估得分并精确到小数点,首先要确保使用的代码库一致。 一般情况下,你可以选择使用作者提...

阅读:8 评论:0