在 AI 自动化时代,“执行力”已经不是智能体系统的唯一衡量标准。 面对医疗诊断、科研助理、电商运营等需要持续优化和多步协作的复杂任务,我们需要的不只是多个 AI Agent,而是一个会思考、会进化的 Agent 生态系统。 作为一名热衷开源项目的科技博主,我最近发现了一款堪称“黑科技”的工具:EvoAgentX,一个具备自我进化能力的多智能体自动化系统! ...
现在大家都用强化学习(RL)来训练大语言模型(LLM)做比较复杂的推理任务,比如数学题。其中,像 PPO 这样的算法虽然主流,但它需要额外的网络(critic network),搞得比较复杂和麻烦。 同时,像 GRPO 这样的算法在实践中效果很好(比如训练 DeepSeek-R1),但大家其实不太清楚它到底为什么有效,是不是真的比更简单的方法好很多。 另一...
随着通用人工智能(AGI)日益融入人类生活的各个方面,确保多模态大模型的安全对齐已成为亟需解决的重要问题。现有研究大多聚焦于单模态风险(如有害文本或图像),却往往忽视跨模态组合所潜藏的安全隐患——即便图像与文本各自安全,其组合后却可能诱发模型生成危险响应。 为此,复旦大学、新加坡国立大学联合提出全新多模态安全基准测试,首次系统性定义了安全输入-不安全输出(...
©作者 | 华尔默 单位 | 清华大学博士生 长文本能力对语言模型(LM,Language Model)尤为重要,试想,如果 LM 可以处理无限长度的输入文本,我们可以预先把所有 (文:PaperWeekly) ICML 2025 长文本救星!清华等提出傅里叶位置编码,多项任务全面超越RoPE最先出现在每时AI。
如果国产浏览器的首页不是那么的臃肿难看,动机不是那么过于明显的话,相信它们的市场份额会更高。 但由于诸多历史因素,国产浏览器,大多一直采用的是上网导航风格的首页,看起来像是一个门户网站,也成了某种 PC 互联网时代曾经存在过的活证。 它们竭尽全力提供尽可能多的入口、链接和资讯,却往往忽视了用户打开浏览器的真实意图。 时代变了,AI 来了。浏览器厂商终于回过味...
允中 发自 凹非寺 量子位 | 公众号 QbitAI 检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括: 代码向量模型BGE-Code-v1 多模态向量模型BGE-VL-v1.5 视觉化文档向量模型BGE-VL-Screenshot 这些模型取...
图片来源:Graphiant Graphiant 公司致力于为人工智能改造数据网络,根据投资协议计划在利雅得设立区域总部。 此次投资是沙特阿拉伯成为地区科技强国的重大举措之一,近期已在人工智能基础设施和早期初创企业领域达成总计数十亿美元的交易与投资。 沙特阿美旗下Wa’ed Ventures 与沙特电信公司的 Tali Ventures 共同向这家网络...
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 仅需5000美元就能实现人形机器人3D打印? UC伯克利这次又又又整新活了! 注意看,画面中这个正在认真写名字的小家伙,就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite (BHL)。 它一笔一划的认真模样,仿佛在宣布:“Hello world!” 身高不足1米,体重...
vivo端侧大模型团队 投稿 量子位 | 公众号 QbitAI 在端侧设备上处理长文本常常面临计算和内存瓶颈。 vivo AI研究院推出的EdgeInfinite算法专为端侧设备设计,让设备处理超长文本时更加高效流畅,该方法能够在不到10GB GPU内存的设备上处理长达128K tokens的输入。 该研究成果已中稿ACL 2025。 以下是更多详细内容介...
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI “这可能是英特尔十年以来最明智的决定。” 发生了什么让硬件发烧友们如此感慨?—— 英特尔新显卡来了,并且定价出人意料的便宜: 16GB显存的Arc Pro B50只卖299美元(约合人民币2156元)。 24GB显存,专为AI工作站设计的Arc Pro B60,单价则为500美元(约合人民币3605元)。...