在大规模语言模型(LLM)的训练过程中,强化学习(RL)已被证明能够在没有监督微调的情况下直接增强模型的推理能力。DeepSeek-R1-Zero 的提出,突破了传统的训练方式,通过引入 R1-Zero-like 训练范式,展示了强化学习在提升 LLM 推理能力中的巨大潜力。 然而,这种新兴的训练方法在实践中仍面临着一些挑战,包括如何选择合适的基础模型和优...
文章标题: AIGVE-Tool: AI-Generated Video Evaluation Toolkit with Multifaceted Benchmark 项目主页: https://www.aigve.org/ Github链接: https://github.com/ShaneXiangH/AIGVE\_Tool PyPI Package...
机器之心报道 机器之心编辑部 人类生成的数据推动了人工智能的惊人进步,但接下来会怎样呢? 几天前,Google DeepMind 强化学习副总裁 David Silver 参与了一场播客访谈节目,探讨了如何从依赖人类数据的时代迈向自主学习的时代。 与此同时,David Silver 和他的老师、2024 年图灵奖得主 Richard Sutton 合作撰写...
(图片来源:英伟达官网) 北京时间4月16日凌晨,AI芯片巨头英伟达向美国证券交易委员会(SEC)提交8-k文件称,已经接到美国特朗普政府通知,将“未来无限期”对中国和以色列等D:5国家,禁止出口英伟达H20芯片,除非有许可证。“美国政府表示,许可要求是为了应对相关产品可能被用于或转用于中国超级计算机的风险。” 英伟达透露,截至2025年4月27日的第一季...
4月16日消息,钛媒体AGI获悉,港交所官网显示,滴普科技股份有限公司(以下简称“滴普科技”)于15日晚向港交所提交IPO上市申请书,联席保荐人包括中信证券、民银资本、国泰君安国际、浦银国际、交银国际。 当年被认为是企业“中台”赛道的头部企业的滴普科技,如今在生成式AI热潮下,转型成为企业级大模型 AI 应用解决方案提供商,而且也成为过去7年企业数字化转型...
论文标题:Towards Reasoning Era: A Survey of Long Chain-of-Thought for Reasoning Large Language Models 论文主页:https://long-cot.github.io/ 论文地址:https://arxiv.org/pdf/2503.09567 Github 仓...
新智元报道 编辑:Aeneas KingHZ 【新智元导读】MIT物理学大牛Max Tegmark团队,再出重磅力作。他们发现:AI能够在没有任何先验知识的情况下,完全独立地提出哈密顿物理量,或拉格朗日方程式。仅仅通过尝试解释数据,AI就自己收敛到了这些物理原则,发现了宇宙间的奥秘! 充满想象力的MIT大牛团队,又有新作了! 大佬Max Tegma...
新智元报道 编辑:桃子 好困 【新智元导读】顶会论文评审,AI立大功!ICLR 2025首次大规模引入AI参与审稿,最终有12222条建议被审稿人采纳,89%情况下提升了评审质量。详细30页报告,揭秘AI在顶会审稿的惊人潜力。 你的审稿意见,可能是AI帮忙写的! 去年10月,ICLR 2025正式开启审稿周期,甚至钦定大模型参与评审。 那么,AI参...
组委会 发自 凹非寺 量子位 | 公众号 QbitAI AIGC席卷一切,万物皆可AI! 哪些应用和企业走在浪潮前沿?它们正在如何用AI改变世界? 最新参考来了—— 在第三届中国AIGC产业峰会上,2025年值得关注的AIGC企业/产品出炉! 共有58家企业,53项产品入选。 2025年,生成式人工智能(AIGC)正迈入大规模应用的新阶段。从大模型的技术突破...
新智元报道 编辑:犀牛 定慧 【新智元导读】Anthropic推出Claude两大重磅功能:Research与Google Workspace集成!Research功能让Claude快速检索网络与内部文件,精准回答复杂问题;而与Google Workspace的深度整合,则让用户能无缝调用Gmail、日历和文档信息,轻松完成从行程规划到报告撰写的任...