针对现有大模型知识遗忘方法可能损害生成能力的问题,本文基于“以新知覆盖旧知”的理念,提出了 ReLearn —— 一种将数据增强与模型微调相结合的高效知识遗忘框架。 论文题目: ReLearn: Unlearning via Learning for Large Language Models 本文作者: 徐浩铭(浙江大学)、赵宁远(厦门大学)、杨理明(...
在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。随着 GPT-o3,DeepSeek R1 等具备 「超级上下文窗口」 能力的大模型持续刷新业界记录,百万甚至千万 Token 级别的推理任务已从研究话题迈入现实场景。 然而,生成这些超长文本的背后,却隐藏着令人咋舌的计算成本 —— 长时间的等待、巨大的内存...
PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb 是 PyTorch 提供的一项环境变量配置,用于控制 CUDA 显存分配的行为。通过指定此参数,可以有效管理 GPU 显存的碎片化,缓解因显存碎片化而导致的 “CUDA out of memory”(显存溢出)问题。 一.基本原理 在 PyTorch 中,CUDA 显存的管理...
本文详细剖析了Nginx常用负载均衡算法的核心原理和适用场景,包括默认的轮询(Round Robin)算法、加权轮询算法、IP哈希算法、最少连接数算法以及哈希算法。文章通过清晰的理论解析与具体配置示例,帮助开发者深入理解不同算法的特点与局限性,为实际场景选择合适的负载均衡策略提供参考依据。 一.轮询(Round Robin)算法(默认) 1.原理 将客户端...
图片来源:LM Arena LM Arena 是一个众包基准测试项目,各大 AI 实验室依赖其测试和推广自家 AI 模型。据彭博社报道,该项目已在种子轮融资中筹集 1 亿美元 ,估值达 6 亿美元。 a16z(安德森·霍洛维茨基金) 和加州大学投资管理公司(负责管理加州大学投资组合)共同领投本轮融资;光速创投、Felicis 风投和凯鹏华盈也参与了投资...
作者_|Yoky 邮箱|_yokyliu@pingwest.com 我的工作搭子终于懂我的工作了! “昨天开会说了哪些重点?”“这个季度的目标在哪个文档?”以前一旦涉及到动态私有化的工作环境,哪怕是再聪明的大模型产品也无法搞定,工作搭子不懂具体的工作场景,只能手动查找、反反复复传资料。 5月21日,飞书上线了「知识问答」功能,它巧妙地激活企业沉淀在飞书的消...
腾讯混元AI数字人团队 投稿 量子位 | 公众号 QbitAI 判断AI是否智能,评价维度如今已不仅限于刷榜成绩。 当大模型在“IQ”上不断实现新的突破,“懂人心”、“解人意”开始成为实际应用中,人们对大模型新的要求。 所以,AI的“EQ”又该如何评价? 由腾讯混元AI数字人团队打造的全新自动化评估框架——SAGE(Sentient Agent as a J...
图片来源:Siro 越来越多的会议开始配备AI 记录员,它能转录通话内容并提供行动事项。Siro 希望为一线面对面与客户交谈的销售人员提供同样的服务。 该公司周三宣布已完成由SignalFire 领投的 5000 万美元 B 轮融资,Dick Costolo 与 Adam Bain 的风险投资公司 01 Advisors 参与跟投。 Square ...
作者_|王兆洋 邮箱|_wangzhaoyang@pingwest.com 在Google I/O的第二天,硅星人有机会和Google CEO Sundar Pichai交流。在这场小范围的沟通中,Pichai及Google的多名核心业务负责人回答了从搜索到广告再到AI等多个问题。 今年是Pichai执掌Google的第十年,过去三年带领Google从Op...
整理 | 华卫 今日凌晨,OpenAI 的 CEO Sam Altman 突然宣布,他们将收购 IO——这家成立仅一年、由苹果前高管、iPhone 设计师 Jony Ive 领导的初创公司。 在联合采访中,Ive 和 Altman 拒绝透露这类设备的具体形态和运作方式,但表示希望明年分享细节。58 岁的 Ive 将这一愿景形容为“星际级”,目标是创造“提...