安爸-超级家庭
bg

AI信息差

ICLR 2025 软提示不再是黑箱?浙大、阿里云重塑Prompt调优思路

本文深入分析了 prompt tuning 的推理机理,并针对分析结果提出了动态提示扰动的方法,提升 LLMs 在复杂推理任务中的表现。 论文标题: Improving Complex Reasoning with Dynamic Prompt Corruption: A soft prompt Optimization Approach 期刊/会议: ...

阅读:9 评论:0

Rule-based强化学习≠古早逻辑规则!万字拆解o1多模态推理最新进展

随着人工智能领域的不断发展,深度学习模型在多个任务中展现出强大的能力,尤其是在大规模语言模型(LLMs)和多模态大语言模型(MLLMs)中。 最近,DeepSeek R1 的提出引发了对强化学习(RL)在大模型优化中的巨大潜力的广泛关注。特别是,rule-based 的强化学习通过基于规则的奖励机制,成功地为模型提供了一种高效且可靠的优化途径。这种方法不仅...

阅读:9 评论:0

AI抢人大战!阿里国际启动大规模校招,80%为AI岗位

为争夺AI人才,阿里国际接连放大招。据阿里国际招聘官网消息,2026届校招中80%为AI岗位,包括AI算法、研发、AI产品经理等。同时,启动了面向全球的头部AI科技人才培养计划Bravo102。 作为阿里旗下聚焦海外电商的业务集团,过去一年,阿里国际围绕AI和出海进行了全面探索,推出了全球首个外贸领域的AI搜索引擎Accio,还通过AI及Agent的方式,将...

阅读:9 评论:0

MoCha:开启自动化多轮对话电影生成新时代

本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成。第一作者魏聪为加拿大滑铁卢大学计算机科学系二年级博士生,导师为陈文虎教授,陈文虎教授为通讯作者。 近年来,视频生成技术在动作真实性方面取得了显著进展,但在角色驱动的叙事生成这一关键任务上仍存在不足,限制了其在自动化影视制作与动画创作中的应用潜力。现有方法多聚焦于 Talking ...

阅读:8 评论:0

大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?

新瓜,主角是昨天刚刚发布的Meta旗舰大模型——Llama 4 内部爆料:性能不达标,压力下欲“优化”结果? 首先引爆讨论的是一篇来自“一亩三分地”论坛的帖子,发帖人自称是参与Llama 4训练的内部员工,并表示已因此辞职 帖子内容信息量很大,主要说了几点: 1. 性能瓶颈: 尽管团队反复努力训练,Llama 4的内部模型性能始终无法达到开源SOTA(...

阅读:9 评论:0

13万总奖金!AIGC岳阳楼大赛携社区小赛正式开启 千年名楼邂逅AI浪潮

当千年名楼岳阳楼遇上AIGC技术, 会碰撞出怎样的火花? 3月26日,由岳阳市文化旅游开发有限公司主办、云目未来科技(湖南)有限公司联合承办的《“我心中的岳阳楼”AIGC大赛》正式启动。同时社区激励小赛也于即日开赛。我们邀请您以“我心中的岳阳楼——科技与文化交织的千年华章”为主题,用AIGC技术创作短片,参与社区小赛,同时也可参投大赛,争夺丰厚奖励\~ 扫...

阅读:8 评论:0

Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车

机器之心报道 机器之心编辑部 Meta 翻车来得猝不及防。 上周六,Meta 发布了最新 AI 模型系列 ——Llama 4,并一口气出了三个款,分别是 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。 据官方介绍,在大模型竞技场中,它们的排名相当不赖。 就拿 Llama 4 Maverick 来说,总排名...

阅读:9 评论:0

反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?

机器之心报道 编辑:张倩、+0 Noprop:没有反向传播或前向传播,也能训练神经网络。 「我们应该抛弃反向传播并重新开始。」早在几年前,使反向传播成为深度学习核心技术之一的 Geoffrey Hinton 就发表过这样一个观点。 而一直对反向传播持怀疑态度的也是 Hinton。因为这种方法既不符合生物学机理,与大规模模型的并行性也不兼容。所以,Hin...

阅读:8 评论:0

CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!

新智元报道 编辑:犀牛 好困 【新智元导读】LeCun谢赛宁等研究人员通过新模型Web-SSL验证了SSL在多模态任务中的潜力,证明其在扩展模型和数据规模后,能媲美甚至超越CLIP。这项研究为无语言监督的视觉预训练开辟新方向,并计划开源模型以推动社区探索。 最近AI圈最火的模型非GPT-4o莫属,各种风格图片持续火爆全网。 如此强悍的图片生成能力,...

阅读:8 评论:0

论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」

机器之心原创 作者:张倩 「未来,99% 的 attention 将是大模型 attention,而不是人类 attention。」这是 AI 大牛 Andrej Karpathy 前段时间的一个预言。这里的「attention」可以理解为对内容的需求、处理和分析。也就是说,他预测未来绝大多数资料的处理工作将由大模型来完成,而不是人类。 身为经常接触大量文...

阅读:8 评论:0