大模型独立分析公司Artificial Analysis对Qwen3 在GPQA数据集最新评估来了! GPQA – 全称: Graduate-Level Google-Proof Q&A (研究生水平、防谷歌搜索问答) 核心目标: 评估大型语言模型(LLMs)是否真正具备专家级别的知识理解和复杂的推理能力,而不仅仅是信息检索或模式匹配。它旨在衡量...
编辑部 整理自 AIGC产业峰会 量子位 | 公众号 QbitAI AI入职大厂担当程序员编程助手,如今已非新鲜事。 不过,随着实践的深入,新的问题正在出现:AI生成代码需要大量翻修、安全生产难以保障…… “如果不能找到一个合适的切入点,可能会适得其反——用AI不如不用AI。” 作为技术变革的一线亲历者,蚂蚁集团平台智能体验技术负责人徐达峰如是坦言。 聚焦...
新智元报道 编辑:桃子 好困 【新智元导读】今年美国科学院院士名单,刚刚揭晓了!图灵奖得主Bengio、诺奖得主屠呦呦、世界级数学家林芳华等全球顶尖科学家榜上有名。 2025美国科学院院士名单,正式出炉了! 凌晨,美国国家科学院(NAS)正式公布了今年当选的院士名单,共有120位成员和30名外籍院士上榜。 今年名单中同样有不少华人学者的身影,包括...
作者_|蒸蒸 邮箱|_zz@pingwest.com 在2025上海车展上,奔驰全球首发的纯电长轴距CLA车型成为焦点,这款专为中国市场打造的”史上最智能奔驰”,标志着德系豪华品牌智能化转型进入新阶段。 宝马、奥迪同期发布的AI全场景战略,也进一步印证了智能化已成为豪华车市竞争的主战场。 纵观整个车展还会发现,包括BBA在内,越来越多的车企、上游供应商们,...
大家好,我是每日给大家推荐优秀开源项目的小G! 今天要介绍的这个工具,绝对能让运维和开发同学眼前一亮——它完美解决了内网服务安全暴露的痛点,而且完全开源自托管,再也不用忍受商业方案的高昂费用和隐私担忧! 项目介绍:Wiredoor Wiredoor 是一款基于 WireGuard 和 NGINX 的自托管反向VPN隧道工具,专为安全暴露内网服务而生。它就像给...
大家好,我是每日给大家推荐优秀开源项目的小G。 今天要给大家安利的这个神器,绝对能让你的信息获取效率提升200%!想象一下,当别人还在手动刷推特看特朗普发言时,你早已收到AI生成的财经影响分析报告;当同行苦等外媒翻译时,你的企业微信已经弹出中英对照的科技趋势解读…没错,Secretary就是这样一个能帮你”偷跑”的智能助手! 🔍 项目速览 Secretar...
蒙特利尔大学助理教授Bang Liu等研究者共同发表了一份高达256页的报告,对智能体技术进行了全面梳理。这篇满满的报告包含智能体的核心组件、智能体的自我进化、协同进化智能系统、构建安全且有益的AI智能体四大板块。四大板块之下,还分有二十二个小节,囊括了你能想到的所有构建AI智能体的细节。话不多说,先带大家抢先体验一些报告的亮点: 一、AI智能体的构成要素 ...
微软上架了免费的生成式AI入门课程——Generative AI for Beginners。这套课程主打“新手友好”,不需要太深的技术背景,带你从零开始,一步步搞懂生成式AI应用的原理。这套课程具有以下特点: 21堂独立小课,免费、开源、无门槛,可以按兴趣自由学习; 每节课都有概念讲解和代码示例,支持Python、TypeScript; 涵盖了从基础原理...
DeepMind大佬Vlad Feinberg最近回到普林斯顿做了一场超棒的演讲,演讲的主要内容包括: Scaling Law的历史讨论 面对推理限制时,如何调整扩展策略 这次演讲出现了哪些亮点?一起看看看这份PPT的总结: 一、从经典模型开始 当前LLM训练面临的挑战在于,每次新实验必须依赖历史实验的外推。 早在2020年,Kaplan等人发现: ...
本文发现大型语言模型在预填充阶段的隐藏状态中内在地编码了鲁棒的领域特定知识,形成了“潜在领域相关轨迹”,利用这些轨迹进行查询路由的模型选择策略,在提高性能(尤其是在开放式生成任务上)方面出人意料地优于直接使用领域微调模型,揭示了预训练 LLM 内在领域理解的强大潜力。 参考文献: [1] https://arxiv.org/pdf/2504.16871 ...