文丨谭梓馨 在2025年5月国内的AI产品应用榜(APP)上,出现了新奇一幕:国内AI产品中目前月活过亿才能站上牌桌,产品榜单前10名里,百度一家占据了3个名额,百度网盘、百度文库和文小言,而且百度网盘和百度文库的排名竟然比文小言还要高,这背后正在发生什么? 6月10日,在百度AI Day开放日上,答案终于揭晓。百度正在通过关键产品体系的生态融合和能力...
搞科研,最怕的就是每天“眼睛读文献,脑袋想方案”。 以为只要文献读的够多,准备就足够充分,就能找到好选题,写出好文章。 实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。 过来人都知道:科研成果是干出来的,不是读出来的。 那些发了几十篇顶会顶刊的科研老手,都有非常强的执行力。 因为他们掌握着一套成熟的科研实战方法论,从读第一篇文献开始就能带着思路直接进入实...
研究背景:线上文章评分与MLLM的新机遇 自动作文评分(AES)是教育评估中的重要技术工具,能实现对大规模写作的高效、稳定评分。然而,传统 AES 实现存在三大缺陷: 依赖手工特征,通用性差 难以评估细粒度写作特质 无法处理图文处境 随着 GPT-4o、Gemini 等大型多模态语言模型(MLLMs)的应用推广,AES 实现得以突破,直接依靠文本+...
在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现有的视觉 RAG 方法受限于定义的固定流程,难以有效激活模型的推理能力。 来自阿里巴巴通义实验室的最新研究成果——VRAG-RL,将强化学习算法引入多模态智能...
文章转载自「APPSO」 今天凌晨,OpenAI 发布了 o3-pro 模型。 o3-pro 模型作为推理模型 o3 的升级版,在处理复杂问题、给出更精准的回答方面表现更强,尤其在科学研究、编程、教育和写作等场景下,表现更具优势。 但 o3-pro 在处理复杂任务调度和工具链调用时响应速度比 o1-pro 稍慢,更适合于对答案准确性要求较高的场景。 目前,o...
MMSI-Bench团队 投稿 量子位 | 公众号 QbitAI AI能看图,也能讲故事,但能理解“物体在哪”“怎么动”吗? 空间智能,正是大模型走向具身智能的关键拼图。 面对1000道多图推理题,开源大模型集体失守——准确率不到30%,甚至不如瞎猜!就连最强的OpenAI o3,也只答对了41%。 这一专为多图像空间智能设计的MMSI-Bench由上海人工...
作者_|骆轶航 邮箱|_tluo@pingwest.com 我不是一个“懂代码”的人。 作为一家日益专注AI的科技内容社区的CEO,我的团队与AI 创业者和研究人员进行访谈,发布文章,举办各种各样的AI 论坛、黑客马拉松和workshop;我还在硅谷成立了一个 叫GenAI Assembling的AI 开发者社区,定期举办线下活动和闭门讨论。 我们不仅有读...
CreatiDesign团队 投稿 量子位 | 公众号 QbitAI 平面设计师有救了! 复旦大学和字节跳动团队联合提出CreatiDesign新模型,可实现高精度、多模态、可编辑的AI图形设计生成。 △CreatiDesign能生成各种类型的平面设计图,如电影海报、品牌促销、产品广告和社交媒体图。 AI虽然在文生图领域已取得了很大的突破,但以往方法在处理...
欢迎阅览由李榜主发起的:AI产品榜。 第 24 期 AI产品榜·网站榜(Web)(2025 年 05 月)由 AI产品榜、36kr、硅星人|沃垠AI 联名发布。 1 AI产品榜·网站榜(Web) 2025 年 05 月 本文里包含 18 个 AI 榜单,更多/更全 AI产品榜单 可在文末点击 “阅读原文” 免费访问 或 直接访问官网 AI产品榜 aicpb...
MeWM团队 投稿 量子位 | 公众号 QbitAI 医学领域,也有自己的世界模型了。 来自香港科技大学(广州)、约翰霍普金斯大学等机构的学者联合提出了提出医学世界模型(Medical World Model, MeWM),赋予了AI“预演”疾病发展的能力。 MeWM可以基于临床治疗决策,模拟未来肿瘤演化过程,可以为个性化治疗提供可视化、可评估、可优化的辅助...