安爸-超级家庭
bg

AI信息差

如何“用图思考”?小红书与西安交大的多模态深度思考模型DeepEyes

在人工智能领域,多模态模型的发展正逐渐改变我们对智能系统的认知。小红书与西安交通大学联合推出的DeepEyes项目,正是这一领域的前沿探索成果。它通过强化学习实现了“用图思考”的能力,无需依赖监督微调,为视觉推理和多模态任务提供了新的解决方案。 一、项目概述 DeepEyes是一个基于端到端强化学习训练的多模态深度思考模型,由小红书团队和西安交通大学联合...

阅读:9 评论:0

Anthropic × Cursor 对谈实录:程序员的工作方式,正被 AI 重新定义

Anthropic × Cursor,会擦出什么火花? 这几天翻完了一场看似普通但内容密度爆表的访谈 —— Anthropic 请来了 Cursor 的三位核心成员来了一场高质量对话。 从 Claude 的进化、到 Cursor 的产品哲学、再到整个 AI 编程的未来走向,这场对谈基本把「写代码」这件事未来几年可能出现的变革路径,提前剧透了个七七八八。...

阅读:10 评论:0

关于基于人工智能做数据分析的两种方式——SQL和Pandas的区别

“ 人工智能做数据分析的原理是生成相对应的分析语句或代码,而不是直接让大模型对数据进行处理。” 最近在研究基于人工智能进行数据分析,主要研究了基于langchain集成Pandas的数据分析智能体;以及数据分析开源项目Vanna,一个基于大模型做数据分析的框架。 而在对比两者实现原理的过程中就发现了一个问题,基于SQL做数据分析和基于Pandas做数据分...

阅读:9 评论:0

全链路实战解析:企业如何用AI Agent提效50%?|95%的企业将被AI Agent重塑!

最近,一份重磅报告刷爆了AI圈和各大企业微信群——这份报告不仅详细解读了AI Agent的核心概念,更系统梳理了它在企业用户场景下的发展脉络、技术架构与落地实践。 如果你还在观望AI Agent到底能帮企业做什么、如何部署、未来趋势如何,这篇导读将带你一网打尽! 接下来,我们将结合报告精华,从五个维度为你拆解AI Agent的“前世今生”。 1.1 AI ...

阅读:9 评论:0

如何用大模型自动生成PPT?AutoPresent及SlideCoder方案

今天是2025年6月12日,星期四,北京,晴 我们来看文档智能进展,上次是paper2poster,这次是用来做ppt。 从工程上来说,可以使用python-pptx库来创建幻灯片。通过这种方法,可以控制幻灯片的每一个细节,包括文本内容、图像、视觉布局、颜色等。 但可以进一步自动化,例如很直观的做法,就是直接做大模型微调,核心在于搞一批SFT数据集,但是,简...

阅读:11 评论:0

「火山」烧向大厂云

凭借大模型的低价策略,火山引擎在云市场的占有率,距离百度云仅有一步之遥,但它还远未到松一口气的时候。 文| 周鑫雨** 编辑 | 苏建勋 2025年6月11日的“原动力大会”,在这一火山引擎最重要的发布节点上,火山引擎总裁谭待用“激进”一词,回应了有关2025年增长和营收目标的提问。 这份激进,在此前媒体披露的营收数据中可见一斑。据《划重点...

阅读:9 评论:0

Facebook广告库MCP服务器,Claude Code + Gemini AI 协作平台,DevSeeker:AI代码生成

**关注我,记得标星⭐️不迷路哦~ ✨ 1: Facebook Ads Library MCP Server Facebook广告库MCP服务器 Facebook 广告库的模型上下文协议 (MCP) 服务器。它允许用户: 搜索并分析 Facebook 广告库 : 能够搜索任何公司或品牌在 Facebook 上的公开广告库,查看他们当前正在投放的广告并进...

阅读:11 评论:0

一周1.2k星!兼具质量与效率的OCR模型MonkeyOCR,支持多样化的中英文PDF

简介 MonkeyOCR采用结构-识别-关系(SRR)三元组范式,既简化了模块化方法的多工具流程,又避免了使用大型多模态模型处理整页文档的低效问题。 与基于流程的MinerU方法相比,我们在九种中英文文档上的平均性能提升了5.1%,其中公式识别提升15.0%,表格识别提升8.6%。 与端到端模型相比,我们的30亿参数模型在英文文档上的平均表现最佳,超越了G...

阅读:10 评论:0

Mistral AI发布一站式编程助手Mistral Code

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 法国著名开源大模型平台Mistral AI发布了,一站式编程助手Mistral Code。 旨在解决企业开发人员在使用AI编码工具时遇到的合规性和安全障碍。这些障碍常常使得其他编码助手...

阅读:11 评论:0

刚刚,LeCun亲自出镜,Meta推出新世界模型!

机器之心报道 机器之心编辑部 最近,Meta 大动作不断。 前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队,以实现通用人工智能。随后开出 9 位数的薪酬为该团队吸纳人才。 就在刚刚,Meta 又有新的动作,推出基于视频训练的世界模型 V-JEPA 2(全称 Video Joint Embedding Predictive Archi...

阅读:11 评论:0