衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 谢赛宁十年前被NeurIPS_(当时还叫NIPS)_拒收的论文,刚在今年获得了AISTATS 2025年度时间检验奖。 这篇论文就是《Deeply-Supervised Nets》(DSN,深度监督网络),2014年9月挂上arXiv。 时间匆匆,十一年过去,属于是真·时间检验了。 它提出的中间层监督思...
BrowseComp-ZH团队 投稿 量子位 | 公众号 QbitAI 你以为大模型已经能轻松“上网冲浪”了? 新基准测试集BrowseComp-ZH直接打脸主流AI。 BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”: GPT-4o在测试中准确率仅6.2%...
整理 | 华卫 昨日,OpenAI 宣布,其成立之初是一家非营利组织,如今将继续由非营利组织监督和管控。 据 OpenAI 董事会主席 Bret Taylor 称,这一决定是“在听取了市政领导的意见,并与特拉华州总检察长办公室和加利福尼亚州总检察长办公室进行了建设性对话之后”做出的。具体而言,OpenAI 针对公司之后的架构演进制定了一项新计划: Op...
随着语音助手、会议转写、实时翻译等音频处理应用的普及,市场对轻量级、高性能的音频模型的需求日益增长。传统的音频处理模型往往面临参数庞大、计算资源消耗高、难以实时处理长音频等问题。为了解决这些挑战,LMMs-Lab 团队推出了一款名为 Aero-1-Audio 的轻量级音频模型。该模型不仅在参数规模上实现了高效性,还在多个音频处理任务中表现出色,尤其是在长音...
Grok Studio、Workspace、Memory 记忆、视频/语音模式,再加上今天要聊的 PDF 渲染功能 —— 仿佛开了挂的 xAI 总能悄悄整点新活,“钞能力”不鸣则已,一鸣惊人。 如果你用 Word 排版过论文,那么你一定懂:调行距、改字体、修图标、对齐参考文献,整个过程比写论文本身还费劲。 后来,你学会了 LaTeX,以为从此优雅搞定格式...
“ 影响大模型能力的因素有很多,但我们需要具体问题具体分析,不能希望一个技术解决所有问题。” 在人工智能应用场景中,可以说大模型扮演着至关重要的角色,因为大模型是人工智能应用的基座;因此这里就涉及到一个很重要的概念——大模型的能力。 即大模型的能力范围有多大,也就是大模型的能力圈;所以,这里就提出一个问题,大模型的能力是由哪些因素决定的?也可以说怎么提升...
最近在做智能问答系统的项目,深感任务型对话系统的架构正悄然发生变革。 从最初模块清晰的 Pipeline 架构,到如今大模型驱动的 End-to-End 模式,任务型对话系统不再只是冷冰冰的问答机器,而是逐渐成为用户生活中的得力助手。 昨天介绍了《智能问答系统:从规则到深度学习,下一步该怎么走?》。 今天,这篇文章将带你全面理解任务型对话系统的核心概念、主流...
还记得 GPT-4 一出手,横扫千军的场景吗?模型越来越强,参数越来越大,大家也越来越疑惑: 大模型到底怎么记住用户上下文的? 为什么有的 AI 聊天机器人“越聊越聪明”? 多轮对话时,它怎么知道你说的是哪个“它”? 企业级 RAG、Agent 又是怎么协同多个模型、多个模块一起工作的? 这一切的答案,都绕不开一个新词:MCP 协议(Model Comm...
今天是2025年5月6日,星期二,北京,晴。 我们今天来看两个问题。 一个是继续对现有的报告生成项目进行项目代码拆解,讲讲Deepresearch变体之公司报告自动生成company-research-agent,其是一个典型的工作流workflow,看其使用如何基于langgraph来设计节点并且完整的串起来一个项目。 一个是文档智能进展,看看多模态文档大...
作者|IT桔子 封面|公众号AI生成 据IT桔子数据统计,2024年北京共有115家独角兽上榜,其中人工智能独角兽行业公司数量最多,共有29家,占比为25%;估值总和为3617亿美元,占比约59%。 从全国范围来看,北京也是拥有AI独角兽数量最多的城市,这不仅是依靠首都强劲的科研实力和高人才密集度,也得益于北京市政府的扶持,包括政策、资本、配套等层面。 这...