安爸-超级家庭
bg

AI信息差

模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了

机器之心报道 编辑:陈萍、+0 大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计算或内存资源有限的环境中。 例如,Llama-3.1-405B 在 BFloat16(16-bit Brain Float)格式下拥有 4050 亿个参数,需要大约 810GB 的内...

阅读:12 评论:0

中关村科金喻友平: “平台+应用+服务”是企业大模型落地的最佳路径 中国AIGC产业峰会

编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 大模型技术加速向产业渗透,如何直击业务痛点、带来真实增效? “平台+应用+服务”是企业大模型落地的最佳路径。 在第三届AIGC产业大会上,中关村科金总裁喻友平分享如上方法论。 即使看似简单的需求,也需要经历需求拆解、数据调优与流程重构的闭环。在这个过程中,企服厂商需要提供好服务。 为了完整体现喻友...

阅读:10 评论:0

重磅发布 复旦《大规模语言模型:从理论到实践(第2版)》全新升级,聚焦AI前沿

机器之心发布 机器之心编辑部 《大规模语言模型:从理论到实践(第2版)》是一本理论与实践并重的专业 技术书 ,更是AI时代不可或缺的知识工具书。 任何人 都能在本书中找到属于自己的成长路径。 在人工智能浪潮席卷全球的今天,大语言模型正以前所未有的速度推动着科技进步和产业变革。从 ChatGPT 到各类行业应用,LLM 不仅重塑了人机交互的方式,更成为推动学...

阅读:10 评论:0

小小井字棋难倒大模型??大神卡帕西被OpenAI在线踢馆了

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 宝可梦之后,让大模型玩井字棋又成了一个新的热门挑战。 起因是网友在X上吐槽大模型宝可梦玩得不够好,结果被大神Karpathy翻了牌子: 别盯着宝可梦了,让大模型玩井字棋会更有趣,它们不会。 结果Karpathy的话引发了大量围观,有人表示惊讶,也有人在分析原因,还有人表示那句经典的话含金量还在上升...

阅读:12 评论:0

AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实

团队由 IEEE 会士,纽约大学教授 Claudio Silva 和纽约大学研究助理教授钱靖共同指导。 论文由Chenyi Li和Guande Wu共同第一作者。 在无数科幻电影中,增强现实(AR)通过在人们的眼前叠加动画、文字、图形等可视化信息,让人获得适时的、超越自身感知能力的信息。无论是手术医生带着 AR 眼镜进行操作,还是智能工厂流水线前的例行检查...

阅读:10 评论:0

Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品

GeoSense团队 投稿 量子位 | 公众号 QbitAI 多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。 其背后团队来自淘天集团算法技术-未来生活实验室团队。 人类在解答几何问题时,首先会识...

阅读:11 评论:0

纳米AI放大招!MCP万能工具箱,人人都能用上超级智能体

机器之心报道 编辑:Panda 近些年,AI 领域的技术不断快速迭代,各种新名词层出不穷,MoE、强化学习、智能体、computer-use、A2A…… 对没有技术背景的普通用户来说,这些名词和技术概念无疑会带来巨大的认知成本,让他们望而却步,最终让自己与 AI 的交互之路止步于在聊天框中的简单回答。 MCP 自然也是这些技术概念之一。过去一年,AI 智能体...

阅读:13 评论:0

ICLR 2025 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

论文有两位共同一作。郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。然而,标准扩散模型的设计通常只适用于从随机噪声生成数据的任...

阅读:13 评论:0

阿里巴巴开源LHM:只需一张照片,秒变可动画3D数字人!

在人工智与3D技术融合的浪潮中,3D内容生成领域迎来了重大突破。传统的3D建模需要专业的知识和大量的时间,而新兴的AI驱动的3D生成技术正在改变这一局面。阿里巴巴通义实验室最近开源的LHM(Large Animatable Human Reconstruction Model)项目,专注于从单张图像快速生成可动画化的3D人体模型,为3D内容创作提供了全新的...

阅读:14 评论:0

爆料!DeepSeek R2即将发布:1.2万亿参数,成本暴跌97%,真王炸,还是空欢喜?

DeepSeek 这是要搞一波大的了? 一条关于 DeepSeek 新模型的消息在 AI 圈里炸开了锅。 什么?DeepSeek-R2,混合专家模型,5.2 PB 训练数据,1.2 万亿总参数,780 亿动态激活参数,最最炸裂的是,R2 的训练和推理成本比 GPT-4 还要低 97.3%?! 上面这条在 X 平台疯传的帖子,经我调查,源头来自一个叫“韭...

阅读:10 评论:0