小声逼逼:纯分享,非广告,没收一分钱推广费,只是觉得太香了,忍不住来写一篇“真香警告”。 这应该是 AI 领域 2025 年度截至今日最离谱(划算)的「联合会员」。 没错,我当时也是一脸问号点进去看的 —— 结果发现,这事儿居然是真的。 你只要订阅一份叫 Lenny’s Newsletter 的年付会员,立刻就能白嫖 10 款当前很火的 AI + 效率工...
“超级产品狂人”回归。 文| 邓咏仪** 编辑 | 苏建勋 杨轩 《智能涌现》曾独家报道创始人陈航(花名:无招)重返钉钉一事。而在4月上任的这两周,无招已火速在内部开展一场改革。 这场整改覆盖范围很广,从产品设计、排查,到整改,无招都在一线深度参与。 《智能涌现》独家获悉,在回归钉钉的第一天,无招就已经见了P7级别以上的所有产研和设计员工,...
目前,大模型推理领域的强化学习(如R1-Zero)主要面向数学和代码等任务,将其应用于开放式自然语言生成任务(如,机器翻译),面临着奖励设计困难、推理能力诱导不确定、泛化能力待验证等诸多未知的挑战。 针对这些难题,我们提出了 MT-R1-Zero,首次将 R1-Zero 范式成功扩展到机器翻译领域的实现。该方法无需监督微调或依赖思维链(CoT)等冷启动数据...
多模态大语言模型(MLLM)作为具身智能(Embodied AI)和自动驾驶(Autonomous Driving)的端到端解决方案已成为主流趋势,并在视觉语义理解任务中取得了显著进展。 然而,它们在现实世界应用中执行精确、定量时空理解(例如估计和预测物体的外观、姿态、位移和运动)的能力很大程度上未经检验,这使得它们在物理世界交互中的前景充满不确定性。 为...
机器之心报道 机器之心编辑部 深夜,OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。该系列模型经过训练,会在响应之前进行更长时间的思考。 OpenAI 表示,这是他们迄今为止发布的最智能模型,也标志着 ChatGPT 能力的巨大飞跃。 这次新发布的推理模型能够像智能体一样使用并组合 ChatGPT 中的每一个工具 —— 这包括搜索互联...
字节放出推理模型大招。 作者 | 陈骏达 编辑 | 心缘 智东西4月17日报道,今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平。 在数学、编程、科学领域,豆包1.5·深度思考模型的测试表现超过DeepSeek-R1、QwQ-32B等国产推理模型,与O...
当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率,这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力。 然而,当前视觉模型预训练很难提升到更高的分辨率,核心原因在于计算代价过于高昂。比如 SigLIP,在预训练过程中需...
新智元报道 编辑:编辑部 ZJN 【新智元导读】OpenAI新模型全网实测惊艳来袭!o3缩放图像被玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役已经重回榜首,甚至有经济学家直言AGI已经来临! 昨夜o3的发布,让人不尽感慨:打了这么久嘴炮的OpenAI,这回终于实实在在拿出了点真东西。 史上首次...
最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。 论文主页: https://madaoer.github.io/projects/physically\_plausible\_video\_generation/ 论文链接: https...
新智元报道 编辑:犀牛 英智 【新智元导读】悬疑小说的最后一页,隐藏着罪犯的真相。《逆转裁判》的法庭上,真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台,o1、Gemini 2.5 Pro等模型化身「侦探」,测试AI的推理极限。 当谈到AI为何能从「预测下一个词」中诞生智慧时,Ilya Sutskever曾用一个生动的比喻来解释。 想象你...