AI信息差 - 安爸-超级家庭

AI信息差 2025-06-07

多模态模型挑战北京杭州地铁图！o3成绩显著，但跟人类有差距

ReasonMap团队投稿量子位 | 公众号 QbitAI 近年来，大语言模型（LLMs）以及多模态大模型（MLLMs）在多种场景理解和复杂推理任务中取得突破性进展。然而，一个关键问题仍然值得追问：多模态大模型（MLLMs），真的能“...

安爸

17 0

AI信息差 2025-06-07

刚刚，11 个 AI「鲁迅」大战 2025 高考作文，谁能得满分

刚刚，今年的高考作文题正式出炉。我们常说，「如果鲁迅活在今天，会写什么？」现在，我们不妨认真想一次。当 2025 年高考作文题摆在他面前，家国情怀、梦想、第二次呼吸、修身观这些词汇蜂拥而来时，先生会如何提笔说出他独有的洞察。 ...

安爸

16 0

AI信息差 2025-06-07

谷歌Transformer过时了？清华姚班校友等三连击，爆改注意力！

新智元报道编辑：KingHZ 【新智元导读】RNN太老，Transformer太慢？谷歌掀翻Transformer王座，用「注意力偏向+保留门」取代传统遗忘机制，重新定义了AI架构设计。全新模型Moneta、Yaad、Memor...

安爸

16 0

AI信息差 2025-06-07

你永远叫不醒装睡的大模型！多轮对话全军覆没，性能暴跌39%

新智元报道编辑：LRS 【新智元导读】20万次模拟实验，耗资5000美元，证实大模型在多轮对话中的表现明显低于单轮对话！一旦模型的第一轮答案出现偏差，不要试图纠正，而是新开一个对话！ ChatGPT将大模型技术推动到「对话」场景...

安爸

16 0

AI信息差 2025-06-07

别被MCP的包装骗了！重构系统、向智能体转型，CEO亲述：关键时刻还是RPA兜底？

作者 | 褚杏娟当下，智能体的热度已经无需再多赘述。这场智能体竞赛中，除了那些从新开始的“AI 原生”智能体应用外，还有一些应用在逐渐将智能体纳入产品构建中，实在智能便是其中之一。实在智能成立于 2018 年7月，以RPA为起点，融...

安爸

15 0

AI信息差 2025-06-07

18天光速打脸！OpenAI刚夸TypeScript最合适，转头就用Rust重写Codex CLI

整理 | 华卫刚刚，OpenAI 正式对外推出了 AI 编码神器 Codex，其目前向 ChatGPT Plus 用户开放。据悉，Codex 在限定时段内提供宽松的使用额度，但在需求高峰期间，可能会对 Plus 用户设置速率限制，以确保...

安爸

16 0

AI信息差 2025-06-07

Pixel Reasoner：滑铁卢等高校联合打造的视觉语言模型，用好奇心驱动的强化学习解锁视觉推理新高度！

在人工智能领域，视觉语言模型（VLM）的发展一直是研究热点之一。随着技术的不断进步，如何让模型更好地理解和推理视觉信息成为关键问题。Pixel Reasoner 作为一款由滑铁卢大学、香港科技大学等高校联合推出的视觉语言模型，凭借其创新的...

安爸

15 0

AI信息差 2025-06-07

Cursor 1.0 正式发布：一个能自己审 PR、修 Bug、跑测试的 AI 程序员

6 月 4 日，Cursor 推出 1.0 正式版本。 1.0 版本加持下的 Cursor 已经不再是简单的“代码补全工具”，它正在变成一个真正意义上的 AI Pair Programmer —— 甚至更像是你组里最靠谱、从不请假的小伙伴。...

安爸

15 0

AI信息差 2025-06-07

SQL语句生成智能体——vanna项目介绍

“ Vanna的核心思想是由大模型替代DBA人员编写SQL，能够直接根据自然语言进行数据分析。” 在大模型应用中有一种技术叫做NL2SQL——自然语言生成SQL语句；在基于人工智能的数据分析场景中，数据库是必不可少的一个环节。但怎么处...

安爸

15 0

AI信息差 2025-06-07

再看知识图谱本体生成：RAG用于Mysql数据转换及非结构化文本生成思路

今天是2025年6月7日，星期六，北京，晴今天来看知识图谱的问题，关于知识图谱本体。我们介绍两个工作，一个是RAG用于Mysql数据生成知识图谱本体，另一个是基于非结构化知识库进行本体生成。一、RAG用于Mysql数据生成知识图谱本体...

安爸

15 0