安爸-超级家庭
bg

AI进家庭

ICLR 2025 高效又稳定!人大团队提出模型剪枝新方法LLM-Streamline

©作者 | 陈晓栋 单位 | 中国人民大学硕士生 来源 | AI Time 模型剪枝是一类重要而且应用广泛的模型压缩方法,其通过移除神经网络中的冗余的结构或权重,在尽量保持模型准确度的前提下减少模型的大小,提高模型的计算速度。 已有的结构化剪枝方法主要在宽度层面进行剪枝,亦即对隐藏状态大小、注意力头数或注意力维度进行剪枝,但这些方法剪枝出来的模型是不能直接...

阅读:10 评论:0

从CoT到MCoT!NUS、港中文等发布「多模态思维链」重磅综述,280篇文献深度解析

随着人工智能(AI)向通用智能(AGI)迈进,单一模态的链式思维(Chain-of-Thought,CoT)已难以应对现实世界中多源异构数据的复杂推理需求。这篇综述全面梳理了 MCoT 的理论框架、技术方法及应用前景,为多模态 AI 研究提供了系统性参考。 论文标题: Multimodal Chain-of-Thought Reasoning: A C...

阅读:11 评论:0

精度飙升13.7%!复旦发布CAD参数化新基准,PHT-CAD框架精准解析工程图纸

引言 在当前的 CAD 参数化任务中,主流方案往往仅聚焦于工程图纸的几何图层,而忽视了标注图层的重要性。上述这一局限性导致许多学术上的解决方案难以直接应用于实际工业设计流程中。 为了填补学术社区中这一类数据集的缺失,本文推出了 ParaCAD——首个整合了标注图层的大规模 CAD 参数化基准数据集。此外,为解决 CAD 参数化任务面临着两大核心挑战(即结...

阅读:14 评论:0

2024 AAAS Fellow名单出炉:华人学者刘威入选

机器之心报道 编辑:+0、蛋酱 近日,2024 AAAS Fellow 名单正式公布! AAAS Fellow 是科学家、工程师和创新者中的杰出骨干,他们在研究、教学、技术、学术界、工业界和政府管理以及向公众传播和解释科学方面的卓越成就得到了各学科的认可。符合提名资格的候选人是那些在科学或应用发展方面做出杰出贡献的科学家,并且在提名年之前至少连续四年担任美...

阅读:14 评论:0

细节厘米级还原、实时渲染,MTGS方法突破自动驾驶场景重建瓶颈

在自动驾驶领域,高精度仿真系统扮演着 “虚拟练兵场” 的角色。工程师需要在数字世界中模拟暴雨、拥堵、突发事故等极端场景,反复验证算法的可靠性。 然而,传统仿真技术往往面临两大难题:首先是视角局限,依赖单一轨迹数据,如一条固定路线的摄像头录像,重建的场景只能在有限视角内逼真,无法支持车辆 “自由探索”。其次是动态失真,同一路口在不同时间可能停满车辆或空无一人...

阅读:11 评论:0

动态场景,开放文本查询!清华哈佛联合建模4D语言场 CVPR 2025

新智元报道 编辑:LRST 【新智元导读】4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用多模态大模型生成物体级的语言描述,并通过状态变化网络实现语义特征的平滑建模,显著提升了动态语义场的建模能力。 构建支持开放词汇查询的语言场在机器人导航、3...

阅读:13 评论:0

百度端到端语音语言大模型破局出圈,对话超逼真、成本最高降90%,1秒极速响应

**懂方言、能带情感对话的文小言来了,可免费体验。 作者 | 程茜 编辑 | 漠影 语音交互又被玩出新花样?! 智东西4月2日报道,本周一,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,已首发上线文小言,可免费体验。 用几个关键词概括新升级的文小言就是:语音交互超逼真、超低时延、超低成本。 超逼真指...

阅读:10 评论:0

DeepMind核心论文禁发6个月,Transformer级研究锁死!CEO:不满意就走人

新智元报道 编辑:桃子 好困 【新智元导读】DeepMind内部研究要「封箱」了!为保谷歌在AI竞赛领先优势,生成式AI相关论文设定6个月禁发期。不仅如此,创新成果不发,Gemini短板不提。 DeepMind研究成果,已被按下暂停键。 FT爆料称,由Demis Hassabis领导的谷歌AI部门,正对研究论文发布实施更严格的审查机制。 总结来说,...

阅读:11 评论:0

Runway上新Gen-4,角色、场景一致性顶尖,我们小测了下可灵1.6

作者|沐风 来源|AI先锋官 今年以来,从深度推理模型DeepSeek R1到混合推理模型Claude3.7、到AI Agent产品Manus、到谷歌最强模型Gemini 2.5 Pro,再到GPT-4o的生图功能等等,可以说是王炸不断。 就在昨天,AI初创公司Runway也放出了大招,发布了其最新研发的AI视频生成模型Gen-4,让AI视频更靠近电影级。...

阅读:10 评论:0

谷歌 53% 的 AI 投资砸向这个领域,正在悄悄重塑行业未来

作者|英贤 来源|IT桔子 封面|公众号AI生成 Alphabet(谷歌)作为互联网时代的科技巨头之一,在 AI 技术重塑世界的浪潮中勇立潮头,不仅通过自有的产品和服务推动 AI 发展,也通过风险投资,赋能初创企业,积极参与全球 AI 创业生态的构建。 作者根据 IT 桔子和 Crunchbase 的公开数据统计,2014 年以来,Alphabet(谷歌)...

阅读:12 评论:0