安爸-超级家庭
bg
avatar

安爸

官方出品!OpenAI教你用Agent SDK,10分钟开发智能体

OpenAI发布了首个Agent官方开发指南,帮助开发者如何通过其SDK快速开发智能体。 在这份指南中,OpenAI详细介绍了从智能体的大模型选择,工具定义,复杂智能体,安全护栏等所有开发流程,并附加了大量实际开发案例。 即便你不使用OpenAI开源的AgentSDK来开发智能体,也可以作为开发参考样本,它提供了清晰的开发框架和思路,无论是开发老鸟还是刚入门...

阅读:13 评论:0

微软上线两款新模型:增强RAG和AI Agent

微软在官网宣布,在Azure AI Foundry上线了Cohere的Embed 4和 Command A两款新模型,主要用于增强RAG以及AI Agent。 Embed 4是一个多模态嵌入模型,支持超过 100 种语言。能够将多种语言的查询和文档编码到同一向量空间中,从而实现开箱即用的跨语言搜索。例如,用一个用西班牙语提出的问题可以检索出语义上与之对齐的...

阅读:11 评论:0

AI医疗最真实的需求,藏在超400个医疗机构的调研里

很多人可能不知道,之前医疗行业的数字化极为缓慢。从2009年推出《高科技法案》后,医疗行业从纸质病历到电子病历的转变,花了十几年。 与此形成鲜明对比的是,大模型出来两年后,AI就成为医疗保健行业最重要的催化因素之一。在医疗服务、医疗诊断,以及药物研发,以AI带动的新的技术浪潮正在兴起。 这次,Bessemer联合了AWS和贝恩公司,对医疗行业400多家公司...

阅读:10 评论:0

强化学习推理现状 — 理解 GRPO 以及从推理模型论文中获得的新见解

Sebastian Raschka(《从零构建大模型》作者)刚发的长篇博文:强化学习推理现状 — 理解 GRPO 以及从推理模型论文中获得的新见解。具体内容包括: 理解推理模型 RLHF 基础知识:一切从何开始 PPO 简介:RL 的主力算法 强化学习算法:从 PPO 到 GRPO RL 奖励建模:从 RLHF 到 RLVR DeepSeek-R1 推理模...

阅读:10 评论:0

Introduction to Mathematical Thinking:为数学新手量身打造的课程

Introduction to Mathematical Thinking:为数学新手量身打造的课程,帮助学生快速掌握数学思维和证明技巧。课程内容包括集合论、函数、图论、数学归纳法、基本证明技巧、双重数学符号、数学归纳法、强制归纳法、数学系列、复杂性分析、数学模型等。此外,课程还包括了解和使用证明技术、数学符号和定义、以及如何清晰地表达数学概念。亮点:1. ...

阅读:10 评论:0

Anthropic官方发布的:Claude Code智能编程最佳实践指南

Anthropic官方发布的:Claude Code智能编程最佳实践指南,经其内部使用和社区反馈的经验,整理而成的工作流程和技巧。几个关键点: 1、自定义设置 (1)创建 CLAUDE文件: 这是一个Claude自动读取的特殊文件,用于存储项目相关的上下文信息,例如常用bash命令、核心文件、代码风格指南、测试说明、仓库规范、开发者环境设置以及项目特有的行为...

阅读:10 评论:0

OpenAI的姚顺雨发的长篇博文:人工智能的“下半场”

本文探讨了AI发展的两个阶段,前半段聚焦于模型训练方法,后半段将转向问题定义和评估。“我们正处于 AI 的中场休息时间。 几十年来,人工智能主要致力于开发新的训练方法和模型。而且,它确实取得了成功:从击败国际象棋和围棋世界冠军,到在 SAT 和律师资格考试中超越大多数人类,再到斩获 IMO 和 IOI 金牌。这些载入史册的里程碑——深蓝、AlphaGo、GP...

阅读:12 评论:0

西安交大、港科广开源FortisAVQA数据集,配套MAVEN模型助力鲁棒音视频问答

音视频问答(Audio-Visual Question Answering, AVQA)是一项具有挑战性的多模态推理任务,需要智能系统理解音频-视频输入,准确回答自然语言查询。 然而,现有的 AVQA 方法由于鲁棒性不足,容易学习到训练数据集中的分布偏差,导致在分布外数据上性能表现不佳。此外,当前的数据集也无法全面有效地诊断这些方法的鲁棒性。 为了应对这些...

阅读:11 评论:0

CVPR 2025 双目匹配新突破!DEFOM-Stereo高效利用单目深度基础模型

概况 双目立体匹配是计算机视觉中几十年来经久不衰的一个研究课题,其主要是从矫正的左右目图像中恢复稠密的匹配视差。进入深度学习时代后, 双目匹配的准确度和鲁棒性都得到了稳步的提高。 然而,现在模型仍然受到搜索准确的稠密匹配的一些固有难点的约束,如遮挡(在右图中匹配点没有直接展现),弱纹理/图像模糊/不良曝光(造成匹配难以准确定位),以及高分辨(往往伴随...

阅读:11 评论:0

性能准确率突破96%!上海算法创新研究院发布xVerify:面向推理模型的答案评估器

为什么要做 xVerify? 当前推理模型( Reasoning Model)在多个领域取得了显著进展,但在长推理链、 困难数学表达式、多语言等复杂场景下,答案抽取与验证仍面临以下挑战: 慢思考场景:长推理链包含阶段性结果和自我反思等过程,识别和判断其正确性较为复杂。 表达多样性:复杂数学表达(LaTeX / 分数 / 自然语言)、多语言描述的答案等价...

阅读:11 评论:0