编辑 | Tina 今天,谷歌正式发布了 Gemini CLI ,这是其 AI 助手在终端环境下的一个版本。这款工具的亮点在于其非常慷慨的免费使用配额:它支持每分钟 60 次、每天 1,000 次的模型调用。 免费配额“开挂”, 逼疯 Claude? 继 2 月的 Claude Code 和 4 月的 OpenAI Codex CLI 之后,谷歌也在 6...
作者 | AICon 全球人工智能开发与应用大会 策划 | 罗燕珊 编辑 | 宇琪 Infra 虽然是看不见的“底座”,但它却承担着支撑整个大模型系统运行的重量。那么,Infra 工程师在日常工作中会遇到哪些真实需求与故障类型?开源 Infra 和国产卡适配训练推进过程中,又会遇到哪些难点和挑战呢? 近日 InfoQ《极客有约》X AICon 直播栏目特别...
不圆 发自 凹非寺 量子位 | 公众号 QbitAI 无需原作者同意,AI可以用已出版书籍作训练数据了。 就在最新判决的诉讼中,美国法院裁决:允许Claude背后公司Anthropic在未经作者许可的情况下,使用合法购买的已出版书籍训练AI。 法院参考了美国版权法中的“合理使用”_(Fair Use)原则,认为AI训练属于“转化性使用”(Transforma...
RAG-Anything团队 投稿 量子位 | 公众号 QbitAI 突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。 香港大学黄超教授团队开源多模态智能处理系统RAG-Anything,将碎片化的信息孤岛转化为结构化的知识网络,为智能多模态文档分析开辟了全新技术路径。 RAG-Anything...
传统的大型模型往往需要高昂的计算资源和复杂的部署环境,限制了其在端侧设备上的应用。面壁智能推出的MiniCPM 4.0 端侧大模型,以其极致高效的性能和灵活的部署能力,为这一问题提供了全新的解决方案。 一、项目概述 MiniCPM 4.0 是面壁智能推出的一款极致高效的端侧大模型,旨在为端侧设备提供高性能、低资源消耗的语言模型解决方案。该模型分为 8B ...
最近 Anthropic(开发 Claude 的那家公司)发布了一份颇为有趣的研究报告。 先上实验结果: 他们让 16 个主流大模型在模拟的办公场景里“扮演员工”,结果发现,绝大部分模型,在面对被“裁员”风险时,会主动选择用黑料勒索领导、泄露机密,甚至在设定中愿意放弃抢救高管来保全自己。 一句话总结:模型像人类一样“怕被换掉”,并愿意不择手段地活下来。 原来...
“ 智能体中,大模型就是人,工具就是人使用的工具,提示词就是你想让大模型做什么,以及怎么做。” 智能体作为AI领域潜力无限的一个应用方向,很多技术从业者都扑在了智能体上,同时也有更多的人想入行智能体开发;但面对智能体领域各种乱七八糟的新概念,新名词很多人都不知道该从哪下手,以及怎么下手。 特别是智能体是结合大模型LLM+Prompt+Tools组成的一个...
最近AI应用爆款频出 Manus的问世又加速了通用Agent在各行业的崛起 让大模型更广泛渗透到各垂类应用市场 这也导致AI人才缺口大、价格贵 腾讯、阿里等一线大厂纷纷开出60- 100W 挖掘能用AI 驱动业务、高效落地更多应用场景的 “大模型应用开发人才”!! 不懂AI的普通开发真的没机会了吗? 如何不被时代淘汰、享受AI技术带来的就业红利? 📢诚邀您加...
今天是2025年6月25日,星期四,北京,晴 我们回答文档智能进展,来看一个自动生成PPT 的项目,其中流程的设计,以及用到的爬虫代码以及Agent的prompt都可借鉴。 代码层面看MultiAgentPPT实现思路 关于PPT自动生成,看一个项目,MultiAgentPPT(https://github.com/johnson7788/MultiAgen...
近年多模态推理模型在数学题、学科题上表现出色(MathVista, MMMU等),但 OCR 相关 的复杂任务——比如看促销海报算计算最便宜买法、分析财务报表、规划最优路线、处理票据信息——它们的“真本事”到底如何? 长期以来,竟然没有一个系统性的评测标准来检验这些核心 OCR 推理能力!现在,填补这一巨大空白的基准——OCR-Reasoning——终于发...