UniToken团队 投稿 量子位 | 公众号 QbitAI 首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局! 复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。 UniToken通过融合连续和离散视觉表征,有效缓解了以往方...
DyDiT团队 投稿 量子位 | 公众号 QbitAI 算力砍半,视觉生成任务依然SOTA! 达摩院在ICLR 2025上抛出的DyDiT架构:通过时间步长与空间区域的智能资源分配,将DiT模型的推理算力削减51%,生成速度提升1.73倍,而FID指标几乎无损! 更惊人的是,这一突破仅需3%的微调成本。 该方法通过引入动态化调整机制,可精准削减视觉生成任务中...
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 端侧大模型圈子的《速度与激情》,就这么水灵灵地上演了。 坐标上海车展,在长安马自达新车发布之际,车上的智能座舱竟然成了大亮点之一。 因为速度着实有点太快——从零到量产,只花了10个月的时间! 要知道,这件事儿在汽车领域里面,一般都是要按“年”这个单位来计算。 此举可谓是一鸣惊人,一举刷新行业纪录,一步迈进...
Product Hunt 是一个全球知名的创意产品展示与评选平台。Z Potentials 对其近一周的最佳产品 Top10 进行了盘点。 其中,多款 AI 营销与销售类工具上榜,如提升邮件营销送达率的 AI 自动化平台 Mailgo、AI 驱动的 LinkedIn 销售互动自动化工具 Extrovert、一键生成的 AI 语音销售助手 Omakase.a...
因为 OpenAI 30 亿美元的收购报价,Windsurf 成为近期最受关注的 AI 编程公司。 2021 年成立的 Windsurf(前身为 Codeium),最初是一家 ToB 的 GPU 虚拟化平台,并且已经实现了百万美元级别的收入。但在见识到大模型的能力后,创始人 Varun Mohan 意识到,大模型让基础设施端的优势不再明显,应用端才是未来...
作者|沐风 来源|AI先锋官 就在昨天晚间,OpenAI也终于把GPT-4o的生图的API发布了,新模型名为“GPT-image-1”。 此前,GPT-4o的生图功能一经上线就火遍全球,据OpenAI表示,在首周,全球就有1.3亿用户用创作了超7亿张图片。 在此次开源的新模型GPT-image-1中,与GPT-4o相关的功能又有两个: 生成(Generat...
编译 | Tina 很多人都觉得 2025 年会是“AI 智能体元年”,也就是基于 OpenAI、Anthropic、Google 和 DeepSeek 等机构提供的大语言模型,打造专注特定任务的智能体系统。 但是,最近在社交平台 X 上有个调查显示,现在大部分 Agent 都在“玩票”阶段,还没真正走出实验室,普遍滞留在“企业试点”的状态中。 不过,...
导读:电影《钢铁侠》中的 Jarvis 不仅是钢铁侠托尼的实验室助手,更是他战甲的控制核心,同时也是史塔克大厦的智能管理者。每个人都想拥有属于自己的 Jarvis,它代表了我们对人工智能的美好想象,也成为 AI Agent 的经典代表。本文将介绍 8 大国内主流 AI Agent 平台,帮助 AI Agent 选型。 为什么每个人都需要 AI Agent...
《科创板日报》记者获悉,智谱宣布对旗下多款大模型产品进行价格调整, 其中,GLM-4-Plus降价90%,从50元/百万tokens降至5元/百万tokens(相当于每亿tokens 500元),较行业价格低92%。(记者 李明明) (文:财联社AI daily) 智谱大模型,降价90%!最先出现在每时AI。
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI AI智能体,已经被装进了电视。 只要描述想看的情节,电视就能自动帮你找到相应的影视作品,不知道剧名也没关系。 还能帮你规划旅游行程,在大屏幕上更清晰地显示推荐的景点、美食和机酒。 这两个场景,背后都是互联网电视企业酷开科技最新发布的AI智能体。 除了影音和生活之外,还有教育、健康、创作和设备四款智能...