新智元报道 编辑:KingHZ 桃子 【新智元导读】强化学习可以提升LLM推理吗?英伟达ProRL用超2000步训练配方给出了响亮的答案。仅15亿参数模型,媲美Deepseek-R1-7B,数学、代码等全面泛化。 强化学习Scaling来了! 刚刚,英伟达团队提出全新训练方法——ProRL,成功将RL扩展到2000步。 论文链接:https://...
作者 | 褚杏娟 “我们正处在 Agentic AI 爆发的前夜。”在亚马逊云科技中国峰会上,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松说道。他表示,过去一年,机器智能已经爆发了,如今 AI 的发展又来到了一个拐点, “在过去一年,大模型的能力在各个维度都实现了跨越式发展。就连在 2025 年 1 月推出的 HLE — Humanity’s Las...
在人工智能领域,时间推理能力一直是大型语言模型(LLMs)的薄弱环节。尽管这些模型在语言理解、生成和复杂推理任务中表现出色,但在处理时间相关的任务时,如预测未来事件的时间或生成合理的未来场景,它们往往显得力不从心。为了突破这一瓶颈,伊利诺伊大学香槟分校的研究团队开发了Time-R1。 一、项目概述 Time-R1 是伊利诺伊大学香槟分校研究团队开发的基于...
📢本周AI快讯 | 1分钟速览🚀 1️⃣ 🎯 MiniMax 开源百万上下文推理模型 :MiniMax-M1 发布,MoE 架构,总参数 4560 亿,支持百万 tokens 上下文,是 DeepSeek-R1 的 8 倍,AIME 2024 正确率达 86%。 2️⃣ 🎬 MiniMax 推出视频模型 Hailuo 02 :第二代视频模型,参数量提升 3 ...
老刘说NLP技术社区,自建立以来,旨在以公正、客观的角度,围绕大模型&RAG&文档智能&知识图谱四个方向,展开每日早报、社区讨论、月度不定时分享、月度备份、专题整理等多种形式,以期达到一个较好的技术分享。 一起共创,共同地提升老刘说NLP的价值感和技术深度感,将是一件十分有意义的事儿,我们正在朝这个方向...
今天是2025年6月22日,星期日,北京,晴 今天来看看Agent话题,关于9个MCP工程实践项目,尤其是直观图,从可视化的图中观察实际的实现流程,给出的链接里面也有手把手教学的解释,很不错。 9个MCP工程实践项目指引 1、100% local MCP client 100%本地MCP客户端,MCP客户端是人工智能应用程序(例如Cursor)中的一个组件,...
本项目基于MCP知识图谱记忆服务器开发,保留了其核心功能。 项目简介 MemoryMesh 是一个专为AI模型设计的知识图谱服务器,但其灵活的设计也适用于社交网络模拟、组织规划等各种涉及结构化数据的场景,特别适用于基于文本的角色扮演游戏(RPG)和互动叙事场景。它帮助AI在对话中保持结构化记忆的一致性,实现更丰富、更动态的交互体验。 核心特性 动态模式驱动...
腾讯最近开源了一个声音驱动画面的模型,叫HunyuanVideo-Avatar(混元-阿凡达)。 通过简单试用,我感觉这类工具即将快速普及,对短视频以及直播行业冲击非常大。 可以出离谱的一眼AI但非常有趣的视频,可以出以假乱真替代真人的视频。 未来短视频自媒体如何运作,都需要好好思考了。 论文摘要: 近年来,基于音频的人体动画取得了显著进展。 然而,仍...
机器之心PRO · 会员通讯 Week 25 — 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 — 1. 概率统计机制下,LLM 推理真的「理解世界了」吗? 简单复读 vs 显性路径,CoT 在推理中担任何种角色?Next Token Prediction 是一种动态建模过程,CoT 或许并非简单的复读?基于概率统计的 LLM...
新智元报道 编辑:英智 【新智元导读】熬夜写作业却被AI检测判成ChatGPT代笔,成绩归零还可能毕不了业!休斯顿大学的Leigh Burrell靠15页证据才洗清冤屈。AI检测工具误判频出,逼得学生录屏自证清白,教育界的信任正在崩塌。连老师自己的文章都被标成AI生成? AI时代,教育界正经历信任地震。 想象一下,你花了两天熬夜改出一篇作业,自信满...