整理 | 华卫 昨日,Meta 推出了其新的“世界模型”V-JEPA 2,旨在实现物理世界中顶尖的视觉理解与预测能力,以提升 AI 主体的物理推理能力。对于构建能在物理世界中运作的 AI 智能体和实现高级机器智能(AMI)的工作而言,物理推理能力至关重要。 在一段发布的 V-JEPA 2 视频演示中,图灵奖获得者、Meta 首席 AI 科学家 Yann L...
整理 | 华卫 近日,新一代“面壁小钢炮” MiniCPM4.0 端侧模型发布,拥有 8B 、0.5B 两种参数规模 。 一款 8B 稀疏闪电版,带来端侧性能大跃升;一款 0.5B “以小博大”,适配广泛终端场景。 模型相关链接 Github 链接:https://github.com/openbmb/minicpm Huggingface 链接:ht...
6月11日,字节跳动旗下云业务平台火山引擎发布豆包大模型1.6,依据模型调用的上下文长度(即模型能处理的对话记忆范围),首度推行区间梯度定价策略。其中,最低价格区间的模型调用综合成本,相较4月中旬推出的豆包1.5深度思考模型下降63%,公司称这主要得益于技术层面的工程优化。 火山引擎总裁谭待解释说,一些模型厂商会根据是否启用深度思考或多模态功能来差异化定价...
在人工智能领域,多模态模型的发展正逐渐改变我们对智能系统的认知。小红书与西安交通大学联合推出的DeepEyes项目,正是这一领域的前沿探索成果。它通过强化学习实现了“用图思考”的能力,无需依赖监督微调,为视觉推理和多模态任务提供了新的解决方案。 一、项目概述 DeepEyes是一个基于端到端强化学习训练的多模态深度思考模型,由小红书团队和西安交通大学联合...
Anthropic × Cursor,会擦出什么火花? 这几天翻完了一场看似普通但内容密度爆表的访谈 —— Anthropic 请来了 Cursor 的三位核心成员来了一场高质量对话。 从 Claude 的进化、到 Cursor 的产品哲学、再到整个 AI 编程的未来走向,这场对谈基本把「写代码」这件事未来几年可能出现的变革路径,提前剧透了个七七八八。...
“ 人工智能做数据分析的原理是生成相对应的分析语句或代码,而不是直接让大模型对数据进行处理。” 最近在研究基于人工智能进行数据分析,主要研究了基于langchain集成Pandas的数据分析智能体;以及数据分析开源项目Vanna,一个基于大模型做数据分析的框架。 而在对比两者实现原理的过程中就发现了一个问题,基于SQL做数据分析和基于Pandas做数据分...
最近,一份重磅报告刷爆了AI圈和各大企业微信群——这份报告不仅详细解读了AI Agent的核心概念,更系统梳理了它在企业用户场景下的发展脉络、技术架构与落地实践。 如果你还在观望AI Agent到底能帮企业做什么、如何部署、未来趋势如何,这篇导读将带你一网打尽! 接下来,我们将结合报告精华,从五个维度为你拆解AI Agent的“前世今生”。 1.1 AI ...
今天是2025年6月12日,星期四,北京,晴 我们来看文档智能进展,上次是paper2poster,这次是用来做ppt。 从工程上来说,可以使用python-pptx库来创建幻灯片。通过这种方法,可以控制幻灯片的每一个细节,包括文本内容、图像、视觉布局、颜色等。 但可以进一步自动化,例如很直观的做法,就是直接做大模型微调,核心在于搞一批SFT数据集,但是,简...
**关注我,记得标星⭐️不迷路哦~ ✨ 1: Facebook Ads Library MCP Server Facebook广告库MCP服务器 Facebook 广告库的模型上下文协议 (MCP) 服务器。它允许用户: 搜索并分析 Facebook 广告库 : 能够搜索任何公司或品牌在 Facebook 上的公开广告库,查看他们当前正在投放的广告并进...