安爸-超级家庭
bg

AI信息差

ml-diffucoder:探索和改进用于代码生成的掩码扩散模型

ml-diffucoder:探索和改进用于代码生成的掩码扩散模型。亮点:1. 提出耦合采样方案,提升扩散模型的训练效率;2. 引入自回归性评分,量化生成过程中的因果模式;3. 通过实验发现扩散模型在代码任务中的独特表现。 参考文献: [1] http://github.com/apple/ml-diffucoder 知识星球:Dify源码剖析及答疑...

阅读:10 评论:0

开源DeepSeek R1增强版:推理效率快200%,创新AoE架构

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 德国知名技术咨询公司TNG开源了DeepSeek R1的增强版DeepSeek-TNG-R1T2-Chimera。 Chimera是基于DeepSeek的R1-0528、R1和V3...

阅读:11 评论:0

AI 编程十字路口:为什么说 Copilot 模式是创业陷阱?

机器之心原创 作者:闻菲 当整个人工智能行业都在为「如何给程序员打造更快的马」而疯狂投入时,一支特立独行的团队选择「直接去造汽车」。 「大模型的发展,更像一场篮球比赛才刚刚打完第一节。所有人都在用第一节的比分去判断整场比赛的胜负,但我们认为,还有第二、三、四节要打。」蔻町智能(AIGCode)创始人兼 CEO 宿文用这样一个比喻,为当前略显拥挤的 AI ...

阅读:10 评论:0

从流量增长到效能提升,企业人必看的AI智能体实战秘籍 锁定7月5日《1 小时 AI 公开课》

流量获客举步维艰、组织效能难以提升、工作效率不尽如人意、沟通效率低下阻碍发展 —— 这些企业普遍面临的四大痛点,正制约着企业的前行脚步。而智能体 Agent 的出现,正以革命性突破重塑企业运营模式。7月5日晚8点的《1 小时 AI 公开课》,聚焦《AI 智能体,2025 企业生存必修课》,本次课程特邀 AIGC 开放社区首席讲师、TEDx 演讲者、双语培训师...

阅读:9 评论:0

登上热搜!Prompt不再是AI重点,新热点是Context Engineering

机器之心报道 编辑:+0 最近「上下文工程」有多火?Andrej Karpathy 为其打 Call,Phil Schmid 介绍上下文工程的文章成为 Hacker News 榜首,还登上了知乎热搜榜。 之前我们介绍了上下文工程的基本概念,今天我们来聊聊实操。 为什么关注「上下文工程」 我们很容易将 LLM 拟人化——把它们当作能够「思考」、「理解」或「感...

阅读:10 评论:0

华为多路径推理破解大模型数学瓶颈,准确率超97%|ICML 2025

FOT团队 投稿 量子位 | 公众号 QbitAI 大模型越来越大,通用能力越来越强,但一遇到数学、科学、逻辑这类复杂问题,还是常“翻车”。 为破解这一痛点,华为诺亚方舟实验室提出全新高阶推理框架 ——思维森林(Forest-of-Thought,FoT)。 该方法借鉴人类“多角度思考、反复验证”的认知方式,打破传统LLM的线性推理范式,通过构建多棵并行推理...

阅读:10 评论:0

vivo突破手机AI部署难题,绕开MoE架构限制,骁龙8 Elite流畅运行|ICCV 2025

GenieBlue团队 投稿 量子位 | 公众号 QbitAI 在AI迈入多模态时代的当下,“让大模型上手机”成为产业落地的焦点。 现有MLLM在手机端部署时常面临两大难题: 1、纯语言任务性能下降:现有的端侧MLLM在纯文本的任务上表现不尽人意; 2、手机NPU不支持MoE架构:而MoE架构恰恰是多模态训练中保持语言能力的常用手段(比如CogVLM,Win...

阅读:10 评论:0

开源多智能体AI PPT系统,支持MCP。

先讨论个问题,可以在评论区聊聊。 最近有个现象,一大堆的商用工具被不愿意卷的同行开源。 然后这个类型的工具就免费了吗? 我觉得是更卷了。 大部分不懂代码的人还是很难用得上,只是吸引了更多的同行用了更小的代价就把这个产品做出来了。 很多看似很牛的AI工具,其实底层逻辑也就是那样,到最后拼的还是效果和体验。 今天给大家推荐的是一个开源的AI PPT工具,上过班的...

阅读:10 评论:0

线性注意力简史:从模仿、创新到反哺

©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经网络 在中文圈,笔者应该算是比较早关注线性 Attention 的了,在 2020 年写首篇相关文章线性Attention的探索:Attention必须有个Softmax吗?时,大家主要讨论的还是 BERT 相关的 Softmax Attention。 事后...

阅读:10 评论:0

一文搞定八大任务!北航×华为发布时空大模型BIGCity,打通轨迹与交通状态预测

北京航空航天大学联合华为 2012 实验室发布了一项名为 BIGCity 的时空大模型。提出了了一种统一轨迹和交通状态预测任务的新范式。 本文第一作者为北京航空航天大学计算机学院博士生于勰,本文的通讯作者为北京航空航天大学计算机学院教授王静远。 目前该研究已被 ICDE 2025 正式接收,相关代码与模型已经全部开源。 论文标题: BIGCity: A ...

阅读:13 评论:0