Cursor为首的AI编程工具,大家已经用的很熟练了。 不知道你们有没有危机感,AI写代码一个人能顶3个人用了,尤其是对代码小白来说,能几乎零经验做个简单应用。 可能你们没想到的是,这些AI工具的背后,竟然还是提示词工程,把Prompt优化到极致,把用户体验做到极致,就有了Cursor。 Cursor=提示词+工程上的优化。 工程上的优化就是把VS Code...
通过强化学习(RL)来提升大语言模型(LLM)的推理能力,已经成为行业的共识。然而,在跨领域任务(如数学推理和代码生成)中,如何让模型“鱼与熊掌兼得”,仍然是一个巨大的挑战。 近期,快手 Kwaipilot 团队针对现有 GRPO 系列技术方案在处理数学与代码混合数据时表现出的性能瓶颈和效率低下问题,提出了一种全新的方法——两阶段历史重采样策略优化(SRP...
在理解人类行为的视频研究中,第一人称视觉(Egocentric Vision)正成为视频理解、具身智能与虚拟现实等前沿领域的重要突破口。它要求模型不仅能识别物体,还要理解人类如何操作这些物体、为何操作,并预测接下来的动作。 然而,现有数据集大多来自受控环境,缺乏支持真实生活场景中连续、多模态感知的能力。为此,我们提出了 HD-EPIC 数据集,在真实厨房中...
Github 仓库: https://github.com/TheEighthDay/SeekWorld Huggingface 模型: https://huggingface.co/TheEighthDay/SeekWorld\_RL\_PLUS Huggingface 数据集: https://huggingface.co/datasets/TheE...
允中 发自 凹非寺 量子位 | 公众号 QbitAI 当城市天气预报有望精确到街镇,每条马路都可能拥有“独家预报”——这并非科幻场景,而是上海“扶摇”气象大模型带来的突破。 近日,由上海科学智能研究院(下称上智院)与上海市气象局等联合研发的国内首个聚焦超大城市安全的AI气象预报模型正式亮相。 其空间分辨率较传统模式提升3倍至1公里,推理速度从10分钟压缩至3...
做AI眼镜,留给小厂们的时间不多了。 作者 | 云鹏 编辑 | 心缘 “悄然之间,AI眼镜已经成为深圳华强北的第四大标准品,仅次于耳机、手表和无人机”,一位常驻深圳的资深分析师这样说道。 行走于华强北线下卖场,80%左右的手表档口都摆上了AI眼镜,甚至已经出现了2-3家专门卖眼镜的档口,铺面在百平米左右,其中绝大部分都是音频眼镜,少部分是带摄像头的...
UniToken团队 投稿 量子位 | 公众号 QbitAI 首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局! 复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。 UniToken通过融合连续和离散视觉表征,有效缓解了以往方...
DyDiT团队 投稿 量子位 | 公众号 QbitAI 算力砍半,视觉生成任务依然SOTA! 达摩院在ICLR 2025上抛出的DyDiT架构:通过时间步长与空间区域的智能资源分配,将DiT模型的推理算力削减51%,生成速度提升1.73倍,而FID指标几乎无损! 更惊人的是,这一突破仅需3%的微调成本。 该方法通过引入动态化调整机制,可精准削减视觉生成任务中...
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 端侧大模型圈子的《速度与激情》,就这么水灵灵地上演了。 坐标上海车展,在长安马自达新车发布之际,车上的智能座舱竟然成了大亮点之一。 因为速度着实有点太快——从零到量产,只花了10个月的时间! 要知道,这件事儿在汽车领域里面,一般都是要按“年”这个单位来计算。 此举可谓是一鸣惊人,一举刷新行业纪录,一步迈进...
Product Hunt 是一个全球知名的创意产品展示与评选平台。Z Potentials 对其近一周的最佳产品 Top10 进行了盘点。 其中,多款 AI 营销与销售类工具上榜,如提升邮件营销送达率的 AI 自动化平台 Mailgo、AI 驱动的 LinkedIn 销售互动自动化工具 Extrovert、一键生成的 AI 语音销售助手 Omakase.a...