安爸-超级家庭
bg
avatar

安爸

DeepSeek精度效率双提升,华为&信工所提出思维链“提前退出”机制

DEER团队 投稿 量子位 | 公众号 QbitAI 长思维链让大模型具备了推理能力,但如果过度思考,就有可能成为负担。 华为联合中科院信工所提出了一种新的模式,让大模型提前终止思考来避免这一问题。 利用这种方法,无需额外训练,就可以让大模型的精度和效率同时提升。 这种方式名为DEER,也就是动态提前退出推理(Dynamic Early Exit in R...

阅读:8 评论:0

黄仁勋放话:英伟达全员拥抱智能体!

新智元报道 编辑:英智 KingHZ 【新智元导读】软件开发的未来已来!每位工程师都将配备AI智能体,它们将嵌入日常开发,优化代码、发现漏洞、加速原型设计。黄仁勋认为,未来每个人都将指挥多个AI助手,生产力呈指数级增长。 黄仁勋放话:英伟达将全员配 AI 助手! 这可不是随便画个大饼,而是英伟达正在大刀阔斧搞的变革,这趋势可能席卷整个科技圈。 Me...

阅读:10 评论:0

开源全能图像模型媲美GPT-4o!理解生成编辑同时搞定,解决扩散模型误差累计问题

ModelScope团队 投稿 量子位 | 公众号 QbitAI OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。 开源的MLLMs和扩散模型已经过大规模预训练,其从零开始训练统一任务,不如取长补短,将MLLMs的语言建模能力,与扩散模型的像素级图像建模能力,进行有机的结合。 基于这个思...

阅读:8 评论:0

深度|AI教父Hinton:当超级智能觉醒时,人类可能无力掌控

图片来源:CBS News Z Highlights 超级智能一旦觉醒,可能具备欺骗人类、隐藏真实意图的能力。它会假装愚钝、撒谎误导,以实现自身目标。这意味着一旦它想掌控,我们将毫无防备之力,所有传统的控制手段都可能形同虚设。 AI的加速发展虽然带来了前所未有的生产力提升,但它也可能导致大规模失业、底层民众被挤压,甚至进一步削弱民主制度的稳定性。如果不进...

阅读:9 评论:0

谷歌发76页智能体白皮书!你的「AI替身」已上线

新智元报道 编辑:英智 【新智元导读】谷歌最新发布的76页AI智能体白皮书,深入剖析了智能体的应用前景。智能体通过感知环境、调用工具和自主规划,能够完成复杂任务并做出高级决策。从智能体运维(AgentOps)到多智能体协作,这份白皮书为AI智能体指明了方向。 近日,谷歌发表了76页的AI智能体白皮书! 智能体通过感知环境,并利用工具策略性地采取行动...

阅读:8 评论:0

拉 DeepSeek 和通义“组队”斗 OpenAI?小扎首届 AI 大会变“大型商战现场”,和微软 CEO 疯狂互曝!

整理 | 华卫、核子可乐 4 月 30 日凌晨,Meta 举行了其有史以来的首届 AI 开发者大会 LlamaCon。现场,该公司宣布推出一款面向消费者的独立 Meta AI 聊天机器人应用程序,这款应用将与 ChatGPT 展开竞争,同时还发布了一个面向开发者的 API,用于在云端访问 Llama 模型。 这两项产品发布都旨在扩大 Meta 开源 Lla...

阅读:8 评论:0

VITA-Audio:开源超越GPT-4o?端到端延迟仅1.5秒,语音识别误差率低至7.5!

随着人工智能技术的飞速发展,自然人机交互的需求日益增长。语音作为人类日常交流中最自然、最便捷的方式之一,成为人机交互的重要研究方向。然而,现有的语音模型在流式处理中生成首个音频标记时仍面临高延迟问题,这成为部署过程中的一个重大瓶颈。为了解决这一问题,VITA-Audio应运而生。它是一种能够快速生成音频–文本标记的端到端大型语音模型,通过创新的技术架构和训...

阅读:8 评论:0

DeepSeek致谢腾讯,ChatGPT拟推终身会员,谷歌Gemini 2.5重磅升级! AI Weekly 5.5-5.11

OpenAI 或将推出 ChatGPT 终身订阅?网友:这是要跑路了? 📢本周AI快讯 | 1分钟速览🚀 1️⃣ 🚀 腾讯助力 DeepSeek 性能飙升 :DeepSeek 开源的 GPU 通信框架 DeepEP 性能大增,RoCE 环境提速 100%,IB 网络提升 30%,腾讯技术贡献获官方致谢。 2️⃣ 🌟 字节跳动开源多模态助手 :推出基于 L...

阅读:8 评论:0

关于人工智能应用场景中前期数据处理的业务场景和技术分析——包括结构化数据和非结构化数据

“ 文档处理是人工智能应用领域中的重要环节,其业务需求复杂,技术实现难度高;因此,怎么处理复杂文档是每个技术人员都需要考虑的问题。” 文档处理在当前人工智能行业下是一个非常基础也非常重要的工作,不论是模型的训练和微调,还是以RAG检索增强,亦或者是在传统的搜索引擎(包括百度,谷歌这种搜索引擎;以及电商等内部平台的搜索需求)中都是必不可少的一个重要环节。 ...

阅读:9 评论:0

大模型生成过程可视化开源工具、Zerosearch误读及开源项目中的RAG文档解析问题

今天是2025年5月11日,星期日,北京,晴。 我们今天来看大模型生成过程可视化开源工具、Zerosearch误读及开源项目中的RAG文档解析问题。 具体的: 一个是大模型可解释可视化的几个揭示工具,通过获取大模型推理的中间步骤,结合可视化渲染工具,可以得到一些直观化的认识,从而达到一种可解释性的效果。 另一个是技术上的一些有趣发现和挖掘思路,包括关于ze...

阅读:8 评论:0