第一作者为哈尔滨工业大学(深圳)博士生王霄和华为大模型研究员佀庆一,该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成,佀庆一的研究方向为多模态理解、LLM post-training和高效推理。 随着视频内容的重要性日益提升,如何处理理解长视频成为多模态大模型面临的关键挑战。长视频理解能力,对于智慧安防、智能体的长期记忆以及多模态深度思...
机器之心报道 机器之心编辑部 一种全新的学习方法。 这会是 DeepSeek R2 的雏形吗?本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。 当前,强化学习(RL)已广泛应用于大语言模型(LLM)的后期训练。最近 RL 对 LLM 推理能力的激励表明,适当的学习方法可以实现有效的推理时间可扩展性。RL 的一个关键挑战...
机器之心报道 编辑:蛋酱 AI 可能「借鉴」了什么参考内容,但压根不提。 自去年以来,我们已经习惯了把复杂问题交给大模型。它们通常会陷入「深度思考」,有条不紊地展示思维链过程,并最终输出一份近乎完美的答案。 对于研究人员来说,思考过程的公开可以帮助他们检查模型「在思维链中说过但在输出中没有说」的事情,以便防范欺骗等不良行为。 但这里有一个至关重要的问题:...
新智元报道 编辑:编辑部 HNZ 【新智元导读】前OpenAI研究员Daniel Kokotajlo团队发布了「AI 2027」预测报告,描绘了一个超人AI崛起的未来:从2025年最贵AI诞生,到2027年自我进化的Agent-5渗透政府决策,人类可能在不知不觉中交出主导权。 2027年,AI究竟会如何接管人类? 今天,前OpenAI研究员和同事们...
新智元报道 编辑:Aeneas 好困 【新智元导读】特朗普的全新关税政策,被曝是用ChatGPT计算出来的?!越来越多人发现了特朗普纸板上数字的秘密——跟ChatGPT这些AI给出的计算公式几乎一毛一样,这下,可真成「AI治国」了。 就在刚刚,特朗普的关税大棒落下,美国科技股直接遭遇史上最黑暗一天。 由此引发的市场大恐慌,让苹果领衔的「七姐妹」集团...
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。 但随之而来的是一个日益严重的问题:它们太能「说」了!生成的推理过程往往充斥着冗余信息(比如反复定义)、对简单问题过度分析,以及对难题的探...
作者 | 阿虎 Kino 编辑 | 张洁 GPT-4o带来的“吉卜力”风潮还未散去,即梦带着3.0版本杀回来了。 4月2日,字节即梦3.0开启了灰度测试,相较之前的2.1版本,在影视质感、文字响应、清晰度上进行了全面升级。 不少网友已经抢先体验,玩得停不下来: 图片来源:歸藏 图片来源:小互、Orange.ai 图片来源:Solos Lee、Oran...
DeepSeek-R1 模型以其卓越的性能在自然语言处理领域引起了广泛关注,其基于 R1 蒸馏数据进行 SFT(Supervised Fine-Tuning)的小模型也展现出了强大的效果。前段时间,大佬“刘聪NLP”开源了中文 DeepSeek-R1(满血)蒸馏数据集,包括 SFT 版本和普通版本。这一数据集的发布,迅速吸引了众多研究者和开发者的目光,并成...
这是 OpenAI 少有的低调时刻。 没有任何预热和宣传,4 月 2 日,OpenAI 悄然发布了自家的 AI 学院,官方名为 “OpenAI Academy”。 Unlock the opportunities of the AI era by equipping yourself with the knowledge and skills to ha...
AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是指利用人工智能技术自动生成文本、图像、音频、视频等内容。 本报告概述了2025年AIGC(人工智能生成内容)的发展状况,分析了其在技术突破、应用场景拓展、市场规模增长等方面的趋势,并指出了面临的挑战与机遇。 AIGC正深刻改变内容创作与分发模式,...