安爸-超级家庭
bg

AI进家庭

舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。 此次,团队将 LLaDA 拓展至多模态领域,推出了 LLaDA-V—— 集成了视觉指令微调的纯扩散多模态...

阅读:9 评论:0

Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光

一水 发自 凹非寺 量子位 | 公众号 QbitAI 被选为GitHub Copilot官方模型后,Claude 4直接被诱导出bug了! 一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击—— 通过在公共仓库的正常内容中隐藏恶意指令,可以诱导AI Agent自动将私有仓库的敏感数据泄露至公共仓库。 就是说,当用户使用集成了GitHub...

阅读:8 评论:0

低Token高精度!字节复旦推出自适应推理框架CAR

复旦大学余海洋 投稿 量子位 | 公众号 QbitAI 过度依赖CoT思维链推理会降低模型性能,有新解了! 来自字节、复旦大学的研究人员提出自适应推理框架CAR,能根据模型困惑度动态选择短回答或详细的长文本推理,最终实现了准确性与效率的最佳平衡。 推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。 但已有研究...

阅读:8 评论:0

OpenAI 大量内幕曝光!7 年「潜伏」调查扒出 AI 帝国真面目,奥特曼坐立难安公开阴阳

回到 2019 年,OpenAI 还只是一个实验室、一个小作坊,Sam Altman 也 Y Combinator 里的一员,甚至还有一次创业失败的经历。 那时的 OpenAI 是什么样子?前《华尔街日报》记者、现《MIT 技术评论》的人工智能高级编辑 Karen Hao,最有发言权。她在当时就得到机会深入内部,与 Greg Brockman、Ilya Su...

阅读:8 评论:0

扩散语言模型九倍推理加速!上海交大:KV Cache并非自回归模型的专属技巧

EPIC Lab团队 投稿 量子位 | 公众号 QbitAI 首个用于加速扩散式大语言模型(diffusion-based Large Language Models, 简称 dLLMs)推理过程的免训练方法。 上海交通大学EPIC Lab团队提出了一种无需训练、即插即用的高效推理缓存机制:dLLM-Cache。 其核心思想在于,在一个多步去噪过程中,复用相...

阅读:9 评论:0

21 页 PDF 实锤 Grok 3“套壳”Claude?Grok 3 玩自曝,xAI工程师被喷无能!

作者|冬梅 近日,一位 ID 名为 GpsTracker 的网友在网上爆料称,埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时,模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。 网友晒图聊天记录 质疑 Grok 3 套壳 Claude 该用户提供了他与 G...

阅读:9 评论:0

成熟工程师1天完成调试,AI工程实践被MCP彻底颠覆?

作者|冬梅 采访嘉宾|杨小东,华院计算智算平台负责人、技术总监 去年 11 月,Anthropic 发布了模型上下文协议 (MCP),这是 AI 应用程序组件与外部系统或工具之间通信的新标准。开发者社区迅速采用了该协议,并部署了超过 1000 个 MCP 服务器。如今,随着 AWS、GitHub 等巨头公司,甚至 Anthropic 的“竞争对手”Op...

阅读:9 评论:0

Docext:无需 OCR,本地部署的文档提取神器,企业数据处理新选择

在数字化办公日益普及的今天,文档信息提取成为了企业和个人处理大量非结构化数据的重要环节。然而,传统的OCR 技术在处理复杂文档时常常面临准确率低、格式混乱等问题,尤其是在处理敏感信息时,数据隐私和安全性也难以保障。为了解决这些痛点,NanoNets 团队开发了一款开源的本地化工具——Docext,它利用视觉语言模型(VLM)实现无需 OCR 的结构化信息提...

阅读:10 评论:0

AI 写作大乱斗!GPT-4.5、o3、Claude 4、Gemini 2.5,我替你测出了谁最强!

现在不是 AI 能不能写的问题,而是 —— 你选谁来写? 01|开篇:AI 都能写,那我该用谁写? 2025年,AI 写作不再是“能不能写”的问题,而是“哪个写得像人、像我、像爆款”。 OpenAI 有最牛的“非思考”模型 GPT-4.5 和当前最强的推理模型 o3;Anthropic 有刚刚发布、号称最强编程模型的 Claude 4;大善人谷歌有几乎免...

阅读:9 评论:0

新测试的小项目,一天1000,一月3w左右,时间自由,适合打工人!

浮力项目上线!! 测试了三个月的新项目终于出成果了 特别适合每天时间不多,但又想搞点副业的打工人 亲自实操,月入过万很容易,当主业都不过分!! 添加下面的项目号,目前可以限时带10人,人多了也教不好 数量有限,先到先得!(添加了解项目)👇👇👇 这个项目可能是2025年第一个能赚到稳定收入的项目了 符合了我对项目的所有要求, 占用时间少! 利润高!...

阅读:8 评论:0