ReasonMap团队 投稿 量子位 | 公众号 QbitAI 近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。 然而,一个关键问题仍然值得追问:多模态大模型(MLLMs),真的能“看懂图”了吗? 特别是在面对结构复杂、细节密集的图像时,它们是否具备细粒度视觉理解与空间推理能力,比如挑战一下高清地铁图...
刚刚,今年的高考作文题正式出炉。 我们常说,「如果鲁迅活在今天,会写什么?」 现在,我们不妨认真想一次。 当 2025 年高考作文题摆在他面前,家国情怀、梦想、第二次呼吸、修身观这些词汇蜂拥而来时,先生会如何提笔说出他独有的洞察。 截图来自人民日报,向左滑动查看更多内容 因此,我们找来 11 个当下主流的大模型接过鲁迅的名号,试图模仿他的语气与...
新智元报道 编辑:KingHZ 【新智元导读】RNN太老,Transformer太慢?谷歌掀翻Transformer王座,用「注意力偏向+保留门」取代传统遗忘机制,重新定义了AI架构设计。全新模型Moneta、Yaad、Memora,在多个任务上全面超越Transformer。这一次,谷歌不是调参,而是换脑! 谷歌又有新的注意力了! 他们提出的新架...
新智元报道 编辑:LRS 【新智元导读】20万次模拟实验,耗资5000美元,证实大模型在多轮对话中的表现明显低于单轮对话!一旦模型的第一轮答案出现偏差,不要试图纠正,而是新开一个对话! ChatGPT将大模型技术推动到「对话」场景,直接引发了AI技术的爆炸式增长。 用户可以先提出一个粗糙的、不明确的问题,再根据模型的回答逐步完善指令、补充细节,多轮...
作者 | 褚杏娟 当下,智能体的热度已经无需再多赘述。这场智能体竞赛中,除了那些从新开始的“AI 原生”智能体应用外,还有一些应用在逐渐将智能体纳入产品构建中,实在智能便是其中之一。 实在智能成立于 2018 年7月,以RPA为起点,融合AI技术,致力于通过人工智能技术助力人机协同,提供超自动化解决方案。随着技术发展,实在智能对其“数字员工”产品不断升级...
整理 | 华卫 刚刚,OpenAI 正式对外推出了 AI 编码神器 Codex,其目前向 ChatGPT Plus 用户开放。据悉,Codex 在限定时段内提供宽松的使用额度,但在需求高峰期间,可能会对 Plus 用户设置速率限制,以确保其能广泛可用。 并且,现在 Codex 可以在任务执行过程中访问互联网了,用户可用其安装基础依赖项、运行需要外部资源的...
在人工智能领域,视觉语言模型(VLM)的发展一直是研究热点之一。随着技术的不断进步,如何让模型更好地理解和推理视觉信息成为关键问题。Pixel Reasoner 作为一款由滑铁卢大学、香港科技大学等高校联合推出的视觉语言模型,凭借其创新的像素空间推理能力,为视觉密集型任务带来了新的解决方案。本文将详细介绍 Pixel Reasoner 的技术原理、主要功能...
6 月 4 日,Cursor 推出 1.0 正式版本。 1.0 版本加持下的 Cursor 已经不再是简单的“代码补全工具”,它正在变成一个真正意义上的 AI Pair Programmer —— 甚至更像是你组里最靠谱、从不请假的小伙伴。 它不只写代码,它还能审代码、修 bug,甚至能自行给你把测试也跑了。 今天这篇文章,就带你快速扫一眼:Cursor ...
“ Vanna的核心思想是由大模型替代DBA人员编写SQL,能够直接根据自然语言进行数据分析 。” 在大模型应用中有一种技术叫做NL2SQL——自然语言生成SQL语句;在基于人工智能的数据分析场景中,数据库是必不可少的一个环节。但怎么处理数据库中的数据却有不同的思路,比如类似于传统数据分析,使用SQL读取数据库,然后交给大模型进行分析; 第二,使用pan...
今天是2025年6月7日,星期六,北京,晴 今天来看知识图谱的问题,关于知识图谱本体。 我们介绍两个工作,一个是RAG用于Mysql数据生成知识图谱本体,另一个是基于非结构化知识库进行本体生成。 一、RAG用于Mysql数据生成知识图谱本体 关系数据库在数据管理中很重要,但由于其结构化框架,难以进行语义查询和集成。将关系数据库转换为知识图谱(KG)可以促进数...