Pytorch是目前常用的深度学习框架之一,它凭借着对初学者的友好性、灵活性,发展迅猛,它深受学生党的喜爱,我本人也是使用的Pytorch框架。 比起 TF 的框架环境配置不兼容,和 Keras 由于高度封装造成的不灵活,PyTorch 无论是在学术圈还是工业界,都相当占优势。不夸张地说,掌握了 PyTorch ,就相当于走上了深度学习、机器学习的快车道。 ...
今天是2025年5月7日,星期三,北京,晴。 我们今天来看两个问题。 一个是关于Graph用于记忆管理。由于LLMs无法在超出其上下文窗口的对话中维持连贯性,这限制了它们在长时间交互中的表现,所以解决的思路就是采用可扩展的记忆中心架构,通过动态提取、整合和检索对话中的重要信息。这么一来,目前用Graph来做Agent记忆管理看来是个趋势,因为正好涵盖住了抽取...
**关注我,记得标星⭐️不迷路哦~ ✨ 1: oli Oli是基于Rust的开源本地智能助手,可进行代码辅助,具有强大的代理功能。 oli 是一个开源的、智能的代码助手,旨在替代 Claude Code。它具有强大的 Agent 能力,可以辅助进行代码编写和相关任务。oli 采用混合架构,后端使用 Rust 构建以保证性能和核心功能,前端使用 React/...
之前发了浙大、哈佛团队(其实都是中国人)的ICEdit工具,可以实现自然语言修图,接近ChatGPT 4o的效果。 最低仅仅需要6G显存! 4090只需要6秒,我的3060(12G)实测1分钟左右。 不过,原生大模型只能识别英文,所以修图提示词要输入英文,对于英文水平不那么流畅的选手来说,有一点点门槛(当然可以用AI翻译一下再贴过来)。 为了更加简洁,我加...
机器之心报道 编辑:Panda 你的默认编程模型是什么?或许可以换一换了。 刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。 其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显...
Mixture-of-Experts(MoE)在推理时仅激活每个 token 所需的一小部分专家,凭借其稀疏激活的特点,已成为当前 LLM 中的主流架构。然而,MoE 虽然显著降低了推理时的计算量,但整体参数规模依然大于同等性能的 Dense 模型,因此在显存资源极为受限的端侧部署场景中,仍然面临较大挑战。 现有的主流解决方案是专家卸载(Expert Of...
机器之心报道 编辑:+0、刘欣 在大模型飞速发展的今天,推理能力作为衡量模型智能的关键指标,更是各家 AI 企业竞相追逐的焦点。 但近年来,推理效率已成为模型部署和性能的关键限制因素。 基于此,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理...
新智元报道 编辑:编辑部 NYH 【新智元导读】OpenAI天价收购案即将完成。爆料称,OpenAI将出资30亿美元吞并AI编程工具Windsurf,成为其迄今为止最大规模的收购。 OpenAI史上最大一笔收购即将敲定。 彭博爆料称,OpenAI将豪掷30亿美元,吞并了爆火编码神器Windsurf(前身为Codeium)。 此前,早有外媒曝出了这...
本论文第一作者为微软 DKI 团队的 Chaoyun Zhang,其为 Windows 平台首个智能体系统 ——UFO 的核心开发者,该项目已在 GitHub 上开源并获得约 7,000 Stars,在社区中引发广泛关注。同时,他也是一篇超过 90 页的 GUI Agent 综述文章的主要撰写者,系统梳理了该领域的关键进展与技术框架。其余项目的主要贡献者亦...
白交 发自 凹非寺 量子位 | 公众号 QbitAI 因为大家太过热情, Gemini 2.5提前重磅更新—— 史上最强编码模型Gemini 2.5 Pro Preview的I/O版。 只需一张手绘的草图,就可以构建一个「绘图变音频」的网页版应用。 其他游戏、对象模拟等等也都可以通过一句提示完全搞定。 它在所有LMArena排行榜上均超越Claude位列第...