安爸-超级家庭
bg
avatar

安爸

首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源

衡宇 发自 凹非寺 量子位 | 公众号 QbitAI AI替咱打工搞翻译,到底谁家最好用? 终于,有人来统一翻译江湖的标准了:首个应用型AI翻译测评榜单TransBench在OpenCompass上线。 它由阿里国际AI Business团队联合上海人工智能实验室、北京语言大学共同发布。 与传统的翻译测评体系相比,TransBench增加了幻觉率、文化禁忌...

阅读:8 评论:0

一场对话,我们细扒了下文心大模型背后的技术

金磊 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI “我们已经过渡到了可以进行复杂推理的下一个模型范式。” OpenAI CEO奥特曼在年度总结中,给出了他关于大模型未来发展的论断。 推理模型的重要性正在上升,成为了继基础模型之后各家厂商厮杀的新战场。 推理模型百家争鸣,究竟哪家能力更强?最近,这个问题有了答案。 近期,中国信息通讯研究院(信通院)...

阅读:8 评论:0

中国企业「新大航海」时代里,阿里云的底气

打造全球云计算一张网,支持中企出海。 中国智能手机占据全球近半壁江山;每分钟都有中国汽车驶向欧洲;外国玩家沉浸在国产游戏与文化中——一批批“中国智造”品牌不再仅是“物美价廉”的代名词,而是技术创新与品质生活的风向标。 在这场波澜壮阔的中企出海征程中,稳定、高效、安全的云计算和AI技术,则是持续输出澎湃动力的坚实底座。 5月22日,2025阿...

阅读:11 评论:0

上一代机器人公司现在的答卷,会是具身机器人的未来吗

来源|超越S曲线 作者|李刚强 封面|公众号AI生成 2020-2022年期间,机器人赛道迎来过一阵高潮。那时,因为疫情的缘故,投资人和创业者们纷纷认为机器人可以减少人的接触,提高效率,是疫情期间最好的解决方案;又对机器人的未来充满了憧憬,于是在2020-2022年期间,机器人的创业与融资迎来一波高潮。 彼时的机器人创业公司,大致分为几大类: 一是服务机器人...

阅读:8 评论:0

Transformer升级之路:多头潜在注意力机制(MLA)究竟好在哪里?

©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经网络 自从 DeepSeek 爆火后,它所提的 Attention 变体 MLA(Multi-head Latent Attention)也愈发受到关注。 MLA 通过巧妙的设计实现了 MHA 与 MQA 的自由切换,使得模型可以根据训练和推理的不同特性(C...

阅读:8 评论:0

ACL 2025 大模型遗忘之后患上失语症?通过学习新知识实现旧知识遗忘

针对现有大模型知识遗忘方法可能损害生成能力的问题,本文基于“以新知覆盖旧知”的理念,提出了 ReLearn —— 一种将数据增强与模型微调相结合的高效知识遗忘框架。 论文题目: ReLearn: Unlearning via Learning for Large Language Models 本文作者: 徐浩铭(浙江大学)、赵宁远(厦门大学)、杨理明(...

阅读:8 评论:0

ICML 2025  自回归OUT!TokenSwift实现无损3倍加速,超长文本也能飞起来

在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。随着 GPT-o3,DeepSeek R1 等具备 「超级上下文窗口」 能力的大模型持续刷新业界记录,百万甚至千万 Token 级别的推理任务已从研究话题迈入现实场景。 然而,生成这些超长文本的背后,却隐藏着令人咋舌的计算成本 —— 长时间的等待、巨大的内存...

阅读:9 评论:0

PYTORCH_CUDA_ALLOC_CONF基本原理和具体示例

PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb 是 PyTorch 提供的一项环境变量配置,用于控制 CUDA 显存分配的行为。通过指定此参数,可以有效管理 GPU 显存的碎片化,缓解因显存碎片化而导致的 “CUDA out of memory”(显存溢出)问题。 一.基本原理 在 PyTorch 中,CUDA 显存的管理...

阅读:8 评论:0

解析Nginx负载均衡算法原理与应用实例

本文详细剖析了Nginx常用负载均衡算法的核心原理和适用场景,包括默认的轮询(Round Robin)算法、加权轮询算法、IP哈希算法、最少连接数算法以及哈希算法。文章通过清晰的理论解析与具体配置示例,帮助开发者深入理解不同算法的特点与局限性,为实际场景选择合适的负载均衡策略提供参考依据。 一.轮询(Round Robin)算法(默认) 1.原理 将客户端...

阅读:10 评论:0

速递|AI排行榜独角兽诞生:LM Arena获1亿美元融资,估值6亿美元能否洗刷”刷分”指控?

图片来源:LM Arena LM Arena 是一个众包基准测试项目,各大 AI 实验室依赖其测试和推广自家 AI 模型。据彭博社报道,该项目已在种子轮融资中筹集 1 亿美元 ,估值达 6 亿美元。 a16z(安德森·霍洛维茨基金) 和加州大学投资管理公司(负责管理加州大学投资组合)共同领投本轮融资;光速创投、Felicis 风投和凯鹏华盈也参与了投资...

阅读:8 评论:0