安爸-超级家庭
bg
avatar

安爸

比 DALL·E 强太多的 GPT-4o 原生生图模型,终于开放 API 了

还记得 3 月底在 ChatGPT 上线的 GPT-4o 原生生图模型吗? 这个模型一经发布迅速爆红,仅一周时间就有超过 1.3 亿用户生成了 7 亿张图片。 几小时前,OpenAI 正式推出了该模型的 API 版本:gpt-image-1。 不同于此前 DALL·E 系列的单点能力,这次的 gpt-image-1 是一个原生多模态模型,支持从文字生成图片...

阅读:9 评论:0

关于工作流在人工智能领域内的应用分析

“ 工作流与RAG是大模型应用领域阶段性的产物。” 工作流是对工作流程及其各操作步骤之间业务规则的抽象和概括描述。它可以帮助组织和自动化重复性任务,提高工作效率。 智能体作为人工智能应用的一个主要技术形式,其重要性不言而喻;但同样智能体也并不是万能的,因此怎么更好的使用智能体,并串联相关技术环节就成为一个需要解决的问题。 而这就是工作流需要解决的问题,通...

阅读:9 评论:0

15人小团队,两个月从70万干到2000万美金,这个AI项目做对了什么?

哪有什么一夜爆红,不过是七年磨剑:Bolt.new 背后的真实故事。 在 Around the Prompt 最新一期的播客中,Bolt.new 创始人 Eric Simons 与 Logan Kilpatrick(谷歌 AI Studio 产品负责人)和 Nolan Fortman(播客联合主持人)展开了一次深入对话。 Bolt.new,这个过去半年...

阅读:8 评论:0

RAG与Reasoning结合的必要性、实现范式及Agents、RAG产品、大模型安全新总结

今天是2025年4月24日,星期四,北京,晴。 今天我们来看两个问题,一个是检索增强生成(RAG)与推理(Reasoning)的结合必要性及范式,这个也是前沿热点。 另一个是,看看Agents、RAG产品及大模型安全的一些新总结,可以找一些思路。 抓住根本问题,做根因,专题化,体系化,会有更多深度思考。大家一起加油。 一、RAG与Reasoning结合的必要...

阅读:9 评论:0

经纬领投、创新工场、IDG等机构投资一家AI视频公司|投资速递

TIPS 1、下载 IT桔子 APP,实时跟踪国内外一级市场投融资事件。 2、转载请注明来源自 IT 桔子(itjuzi521),侵权必究。 3、建立“投资速递”长期发布合作,请发邮件到 hello@itjuzi.com。 2025 年 4 月 23 日 IT 桔子(itjuzi521) 收录 24 起投资/IPO排队事件 三呆科技获得数千万美元的新一轮投资...

阅读:9 评论:0

多平台上线“内容偏好调节”功能,能破除“信息茧房”吗?

文| 樊文扬 平台推荐什么内容,用户可以自己决定了?近期,小红书、微博、哔哩哔哩等App上出现一项新功能,平台以图表形式向用户直观展示其浏览内容偏好的分布情况,即“信息茧房”的程度,同时支持用户调节不同类别内容的个性化推荐强度。这一变化被认为是落实优化算法规则透明度,实现算法自主可控要求的一个重要举措。 多个平台上线“内容偏好调节”功能 南都·隐私护卫队...

阅读:8 评论:0

OpenAI发布GPT-image-1的api拥有更强的灵活性吉卜力模式更方便,腾讯开源定制化角色生成插件

**关注我,记得标星⭐️不迷路哦~ ✨ 1: GPT-image-1 GPT-image-1 是 OpenAI 最新、最先进的图像生成模型。它是一个原生的多模态语言模型,于今天凌晨1点30通过 API 向全球开发者开放使用。 与 ChatGPT 版本有很大不同,通过 API 使用 GPT-image-1 可以进行更多高级定制,包括控制生成图像的敏感度、生...

阅读:8 评论:0

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

机器之心报道 机器之心编辑部 上个月,OpenAI 在 ChatGPT 中引入了图像生成功能,广受欢迎:仅在第一周,全球就有超过 1.3 亿用户创建了超过 7 亿张图片。 就在刚刚,OpenAI 又宣布了一个好消息:他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1,让开发者和企业能够轻松将高质量、专业级的图像生...

阅读:10 评论:0

炸裂!OpenAI Pro 级图像 API 降临

OpenAI 深夜放大招!GPT-4o原生图像生成 API 正式开放,高清、可控、强编辑! 一句话形容:这是比web端更Pro的版本! API换了一个新名字叫gpt-image-1 ,这意味着,之前在 ChatGPT 里让无数人惊艳的图像生成能力,现在可以被全球开发者集成到自己的应用和工作流里了 但是:要使用 gpt-image-1,开发者需要先完成 [...

阅读:8 评论:0

SLAM3R:北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云

北京大学陈宝权团队和香港大学等高校及业界机构联合推出实时三维重建系统 SLAM3R,首次实现从长视频(单目 RGB 序列)中实时且高质量地重建场景的稠密点云。SLAM3R 使用消费级显卡(如 4090D)即可达到 20+ FPS 的性能,重建点云的准确度和完整度达到当前最先进水平,同时兼顾了运行效率和重建质量。该研究成果被 CVPR 2025 接收为 Hi...

阅读:8 评论:0