在当今数字化时代,大型语言模型(LLMs)在自然语言处理领域取得了显著进展,但在实际应用中仍面临生成幻觉内容或信息过时等问题。为解决这一问题,检索增强生成(RAG)技术应运而生,通过整合外部知识提升模型的生成能力。然而,传统的检索增强方法依赖于与真实搜索引擎的交互,这不仅成本高昂,还存在文档质量不可控的问题。阿里巴巴通义实验室开源的 ZeroSearch ...
一觉醒来,Gemini 2.5 Pro 的天塌了? 如果你平时喜欢用谷歌的 Gemini 2.5 Pro 模型,又碰巧喜欢以 API 调用的形式使用它,那么你可能已经遇到了下面这个 429 报错。 Gemini 2.5 Pro API 429 错误 – Cherry Studio 仔细查看错误日志,会发现这样一句描述:“Gemini 2.5 Pro Pr...
大模型还在卷参数?真落地的风,已经吹向了 AI Agent! ChatGPT 带起了大模型的全民狂欢,Copilot 让“AI 助理”深入开发者心智,而现在,全行业的目光正聚焦在一个更强、更实用的关键形态上——AI Agent。 从自动写代码、智能办公、复杂任务拆解,到具身智能、智能体协作……AI Agent 不再只是“会说话的机器人”,它开始真正 理解目...
今天是2025年5月16日,星期五,北京,晴。 我们说已经过许多关于知识图谱,RAG,文档智能方面的事情,这些都在2024年得到了很好的发展,也涌现出了许多细化的方案,GraphRAG,DeepResearch等层出不穷,Mineru、Mistralocr等文档解析工作也出现了不少,Qwen3也发布了。 但是,目前已经进入到5月份了,仿佛都静了下来?许多gi...
**关注我,记得标星⭐️不迷路哦~ ✨ 1: Open Agent Platform Open Agent Platform是无代码Agent构建平台,支持RAG集成、Agent监督和多种工具连接,简化Agent管理。 Open Agent Platform (OAP) 是一个无需编写代码的 Agent 构建平台,它提供了一个现代化的 Web 界面,用于创...
阶跃星辰携手光影焕像发布并开源 3D 大模型 ——Step1X-3D。Step1X-3D 模型总参数量达 4.8B(几何模块 1.3B,纹理模块 3.5B),凭借坚实的数据基础与先进的 3D 原生架构,可生成高保真、可控的 3D 内容。 Step1X-3D 不止于视觉「好看」,更追求实现「好用」与「可控」,旨在为 3D 内容创作提供强大而可靠的技术引擎。这...
昨天,全球著名开源大模型平台DeepSeek在huggingface发布了,超强开源模型V3的论文。 主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。 其中,DeepSeek-MoE和多头潜在注意力、FP8混合精度训练以及多标记预测等成为关键创新技术。 论文地址:https://huggingface...
昨天,CNBC消息,特朗普已告诉苹果CEO库克,不希望这家科技巨头在印度生产产品。 特朗普说:“我昨天和库克有点小矛盾,我不想让他在印度生产。” 苹果一直在加大在印度的生产力度,计划未来几年在该国生产全球约25%的iPhone,以减少对中国的依赖。目前,该公司旗舰智能手机约90%在中国制造。 特朗普称印度是世界上关税最高的国家之一,并补充说,印度已向美国提...
本文由清华大学和快手可灵团队共同完成。第一作者是清华大学智能视觉实验室在读本科生史明磊。 在生成式 AI 领域,扩散模型(Diffusion Models)已成为图像生成任务的主流架构。然而,传统扩散模型在处理不同噪声水平和条件输入时采用统一处理方式,未能充分利用扩散过程的异构特性,导致计算效率低下,近期,可灵团队推出 DiffMoE(Dynamic To...