来自Meta、西北大学、新加坡国立大学等机构的研究人员,提出了TokenShuffle,为多模态大语言模型(MLLMs)设计的即插即用操作,显著减少了计算中的视觉token数量,提高效率并促进高分辨率图像合成。除了实现超高分辨率图像生成外,生成质量也非常出色。基于27亿参数的Llama模型,新方法显著超越同类自回归模型,甚至优于强扩散模型:在GenEval基...
新动态#ChatGPT购物功能 OpenAI 刚刚宣布了 ChatGPT 的一系列改进,特别是在搜索和购物体验方面,同时还拓展了新的交互方式 从今天开始,当用户搜索产品时,ChatGPT会提供一些推荐,展示这些产品的图片和评论,并提供指向用户购买产品的网页的直接链接。目前,OpenAI 正在尝试涵盖时尚、美妆、家居用品和电子产品等类别 搜索已成为 Cha...
机器之心报道 机器之心编辑部 近日,ISCA Fellow 2025 入选结果揭晓! ISCA Fellow 是由国际语音通讯协会(International Speech Communication Association,ISCA)设立的荣誉称号,旨在表彰在语音通信科学与技术领域做出杰出贡献的会员,包括研究人员、工程师和学者。 该奖项设立于 2007 ...
本篇工作已被电子设计自动化领域顶级会议 DAC 2025 接收,由上海交大计算机学院蒋力教授与刘方鑫助理教授带领的 IMPACT 课题组完成,同时也获得了华为 2012 实验室和上海期智研究院的支持。第一作者是博士生汪宗武与硕士生许鹏。 在通用人工智能的黎明时刻,大语言模型被越来越多地应用到复杂任务中,虽然展现出了巨大的潜力和价值,但对计算和存储资源也提出...
开源大模型新王!Qwen3连发8种规格支持119种语言。 作者 | 程茜 编辑 | 心缘 阿里通义大模型新成员Qwen3系列模型终于亮相! 智东西4月29日报道,今日凌晨4点,阿里云正式开源Qwen3系列模型 ,包含2个MoE模型、6个稠密模型。发布2小时,Qwen3模型在GitHub上的star数已超过16.9k。 其中旗舰模型Qwen3-23...
新智元报道 编辑:编辑部 YZH 【新智元导读】阿里Qwen3凌晨开源,正式登顶全球开源大模型王座!它的性能全面超越DeepSeek-R1和OpenAI o1,采用MoE架构,总参数235B,横扫各大基准。这次开源的Qwen3家族,8款混合推理模型全部开源,免费商用。 就在今天凌晨,备受全球期待的阿里新一代通义千问模型Qwen3开源! 一经问世,它...
DeepNote团队 投稿 量子位 | 公众号 QbitAI 在当前大语言模型(LLMs)广泛应用于问答、对话等任务的背景下,如何更有效地结合外部知识、提升模型对复杂问题的理解与解答能力,成为 RAG(Retrieval-Augmented Generation)方向的核心挑战。 来自清华大学、中国科学院大学、华南理工大学、东北大学、九星(AI9Stars)...
整理 | 褚杏娟 4 月 29 日凌晨,在一众预告和期待中,阿里巴巴终于发布并开源了新一代通义千问模型 Qwen3。 Qwen3 采用混合专家(MoE)架构,总参数量 235B,激活仅需 22B。其中参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型。 Qwen3 还是国内首个“混合推理模...
作者 | Tim Anderson 译者 | 平川 策划 | Tina 本文最初发布于 DEV CLAS。 Docker 推出了自己的 MCP(模型上下文协议)目录和用于管理 MCP 工具的 MCP Toolkit。 MCP Catalog 是 Docker Hub 的一部分,该公司声称其有 100 多台初始服务器,可以访问来自 Elastic、Sa...
文| 严兆鑫 4月28日,南都湾财社记者从人形机器人企业帕西尼感知科技(下称“帕西尼”)方面获悉,其近日获得比亚迪数亿元的战略投资。工商信息显示,比亚迪成为帕西尼最大外部股东,持股约13.37%。 据悉,这是帕西尼第A++轮融资,也是比亚迪目前在具身智能领域最大的单笔投资。本轮融资将用于帕西尼在多维触觉传感技术及人形机器人产品矩阵的研发与量产推进。 帕西...