安爸-超级家庭
bg

AI信息差

OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

新智元报道 编辑:KingHZ 桃子 【新智元导读】o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。 满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据Perso...

阅读:8 评论:0

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

机器之心报道 编辑:陈陈、杜伟 大语言模型的推理能力,不再是 AR(自回归)的专属。扩散模型现在也能「动脑子」,新框架 d1 让它们学会了解数学、懂逻辑、会思考。 当前,强化学习(RL)方法在最近模型的推理任务上取得了显著的改进,比如 DeepSeek-R1、Kimi K1.5,显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能。 ...

阅读:9 评论:0

近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结

选自 quantamagazine 作者:Leila Sloman 机器之心编译 一切始于一场赌局。 20 世纪 80 年代末,在洛桑的一次会议上,两位数学家 Noga Alon 和 Peter Sarnak 展开了一场友好的辩论。两人当时都在研究由节点和边组成的集合即图,他们特别想更好地理解一种名为「扩展图」的看似矛盾的图类型,这种图的边相对较少,但仍然高...

阅读:10 评论:0

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。该模型全部由合成数据训练而成,不仅在传统重建与生成任务中表现领先,更首次赋予大模型在真实世界中的 3D 空间决策与规划能力,可助力机器人完成目标导向的视觉规划、4D 动态重建、动作条件的视频预测等复杂任务。 研究团队将几何重建与生成式建模深度融合,首创「重建 — 预测 — 规...

阅读:11 评论:0

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

新智元报道 编辑:LRS 【新智元导读】Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术,进一步提高了20%推理速度 过去几年,Transformer虽稳坐AI架构「铁王座」,但其二次方复杂度带来的算力消耗和长序列处理瓶...

阅读:8 评论:0

杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型

新智元报道 编辑:犀牛 【新智元导读】谷歌的AI编码能力正在掀起一场风暴!在高尔顿板测试中,Gemini 2.5 Flash以惊艳表现击败OpenAI多款模型,连谷歌首席科学家Jeff Dean都为其点赞。谷歌新模型「dayhush」已在网页开发领域崭露头角,性能超越Gemini 2.5 Pro,被网友称为「AI编码的地震性突破」。 编码能力一直是...

阅读:8 评论:0

AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据

新智元报道 编辑:定慧 【新智元导读】还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没用启发式算法,纯靠47.5万场人类对战回放训练出来,居然打上了Pokémon Showdown全球前10%! AI 又有「新活」了! 德州大学奥斯汀分校的...

阅读:9 评论:0

失意的清华姚班“天才少年”,又开始 AI 创业了

来源|直面AI 作者|张琳 封面|公众号AI生成 AI 2.0时代到来后,那些在AI 1.0时代失意的姚班天才们,开启了二次创业的新征途。 旷视联合创始人、CEO印奇入局智驾,多了一个千里科技董事长的title;姚班天才范浩强及其在旷视的两位前同事共同创办了具身智能公司“原力灵机”。 作为中国人工智能领域的 “黄埔军校”,姚班由世界著名计算机科学家、图灵奖得...

阅读:8 评论:0

MoCha:对话角色视频生成神器,开启虚拟创作新时代!

在人工智能与影视制作、虚拟现实等领域融合的浪潮中,角色动画的自动生成一直是研究的热点。然而,现有的视频生成技术在生成具有真实感的角色动画方面仍存在诸多不足。最近,Meta与滑铁卢大学联合开发的MoCha模型,为这一领域带来了新的突破。MoCha能够根据文本或语音输入生成带有同步语音和自然动作的完整角色动画,其创新的技术架构和训练策略使其在对话角色视频生成方...

阅读:9 评论:0

关于大模型应用协议的发布——MCP和A2A协议的出现意味着什么?

“ 智能体是大模型应用的未来,而协议却是决定大模型应用的行业标准。” 2024年是大模型应用探索的元年,而随着大家对大模型应用的探索,大模型被应用到越来越多的场景;但同时也面临着各种各样的问题。 特别是在智能体方面的应用探索,面临着各种各样的问题;而其中目前最头疼的无非就是各家大模型公司没有统一的标准,关于智能体的技术实现也各式各样;而这直接阻挡了大模型...

阅读:8 评论:0