本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。 此次,团队将 LLaDA 拓展至多模态领域,推出了 LLaDA-V—— 集成了视觉指令微调的纯扩散多模态...
一水 发自 凹非寺 量子位 | 公众号 QbitAI 被选为GitHub Copilot官方模型后,Claude 4直接被诱导出bug了! 一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击—— 通过在公共仓库的正常内容中隐藏恶意指令,可以诱导AI Agent自动将私有仓库的敏感数据泄露至公共仓库。 就是说,当用户使用集成了GitHub...
复旦大学余海洋 投稿 量子位 | 公众号 QbitAI 过度依赖CoT思维链推理会降低模型性能,有新解了! 来自字节、复旦大学的研究人员提出自适应推理框架CAR,能根据模型困惑度动态选择短回答或详细的长文本推理,最终实现了准确性与效率的最佳平衡。 推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。 但已有研究...
回到 2019 年,OpenAI 还只是一个实验室、一个小作坊,Sam Altman 也 Y Combinator 里的一员,甚至还有一次创业失败的经历。 那时的 OpenAI 是什么样子?前《华尔街日报》记者、现《MIT 技术评论》的人工智能高级编辑 Karen Hao,最有发言权。她在当时就得到机会深入内部,与 Greg Brockman、Ilya Su...
EPIC Lab团队 投稿 量子位 | 公众号 QbitAI 首个用于加速扩散式大语言模型(diffusion-based Large Language Models, 简称 dLLMs)推理过程的免训练方法。 上海交通大学EPIC Lab团队提出了一种无需训练、即插即用的高效推理缓存机制:dLLM-Cache。 其核心思想在于,在一个多步去噪过程中,复用相...
作者|冬梅 近日,一位 ID 名为 GpsTracker 的网友在网上爆料称,埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时,模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。 网友晒图聊天记录 质疑 Grok 3 套壳 Claude 该用户提供了他与 G...
作者|冬梅 采访嘉宾|杨小东,华院计算智算平台负责人、技术总监 去年 11 月,Anthropic 发布了模型上下文协议 (MCP),这是 AI 应用程序组件与外部系统或工具之间通信的新标准。开发者社区迅速采用了该协议,并部署了超过 1000 个 MCP 服务器。如今,随着 AWS、GitHub 等巨头公司,甚至 Anthropic 的“竞争对手”Op...
在数字化办公日益普及的今天,文档信息提取成为了企业和个人处理大量非结构化数据的重要环节。然而,传统的OCR 技术在处理复杂文档时常常面临准确率低、格式混乱等问题,尤其是在处理敏感信息时,数据隐私和安全性也难以保障。为了解决这些痛点,NanoNets 团队开发了一款开源的本地化工具——Docext,它利用视觉语言模型(VLM)实现无需 OCR 的结构化信息提...
现在不是 AI 能不能写的问题,而是 —— 你选谁来写? 01|开篇:AI 都能写,那我该用谁写? 2025年,AI 写作不再是“能不能写”的问题,而是“哪个写得像人、像我、像爆款”。 OpenAI 有最牛的“非思考”模型 GPT-4.5 和当前最强的推理模型 o3;Anthropic 有刚刚发布、号称最强编程模型的 Claude 4;大善人谷歌有几乎免...
浮力项目上线!! 测试了三个月的新项目终于出成果了 特别适合每天时间不多,但又想搞点副业的打工人 亲自实操,月入过万很容易,当主业都不过分!! 添加下面的项目号,目前可以限时带10人,人多了也教不好 数量有限,先到先得!(添加了解项目)👇👇👇 这个项目可能是2025年第一个能赚到稳定收入的项目了 符合了我对项目的所有要求, 占用时间少! 利润高!...