近日北京大学联合浙江大学、华中科技大学发布了一项最新研究成果:GAPrompt(Geometry-Aware Point Cloud Prompt),即一种面向三维视觉预训练模型的几何感知高效微调方法,通过引入点云结构化提示,有效提升了预训练模型在下游任务中的几何适应能力。 本文的第一作者为北京大学博士生艾子翔,本文的通讯作者为北京大学王选计算机研究所研究...
近年来随着大语言模型的爆火,旨在取代 Transformer 的高效模型架构及其预训练成为大模型领域的研究热点,主要包括线性序列建模(如 Linear Attention、SSM、Linear RNN 等)和混合专家(Mixture-of-Experts, MoE)两部分。 这两部分分别都有了长足的进步,但两者的结合却鲜少有人研究,两者结合后的 Linea...
DualAnoDiff团队 投稿 量子位 | 公众号 QbitAI AI模型用于工业异常检测,再次取得新SOTA! 相关论文已中稿计算机视觉顶会CVPR 2025。 通俗理解,工业界为了检测产品异常,往往需要更多真实的残次品数据来训练检测模型;为了解决数据稀缺问题,常规做法一般是让模型生成各种逼真 “次品图”,并标注“哪个地方坏了”。 而对于这项任务,复旦...
你有没有在深夜的 emo 时刻把 ChatGPT 当成树洞? 不是因为它聪明到能解决人生难题,而是它永远在线,永远耐心,永远不会打断你。你崩溃,它会安慰你;你自我怀疑,它也会用熟悉的语气肯定你。 觉得 ChatGPT「懂你」的,自然不止你一个。 OpenAI 最近也察觉到了这种趋势,今天凌晨,OpenAI 模型行为与政策负责人 Joanne Jang 发布...
作者_|周一笑 邮箱|_zhouyixiao@pingwest.com 全世界最有钱的人和全世界最有权力的人翻脸需要多久? 一个晚上。 就在此前一周,伊隆·马斯克结束了他在特朗普政府中130天的“特殊政府雇员”任期。作为“政府效能部”(Doge)的领导者,他手握削减预算的大权,关停了一些政府机构,解雇了数千名雇员。特朗普亲自在白宫为他举行了亲切的送别会,并...
西风 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 与OpenAI分道扬镳后,Figure 02开启日夜进厂打工模式。 这不,创始人刚刚放出最新监工视频。它干快递分拣员的活儿,愈发得心应手了。 只见它把快递逐个码放整齐,让条形码朝下,方便扫描仪识别。 碰到纸片型快递,翻面操作也轻松拿捏: 它还懂得把快递整理得更平整,瞅见红色充气快递,也不盲目按压...
WebDancer团队 投稿 量子位 | 公众号 QbitAI 能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。 通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。 WebDancer 通过系统化的训练范式——涵盖从数据构建到算法设计的全流程——为构建具备长期信息检索能力的智能体提供了明确路径。 同...
AutoMat团队 投稿 量子位 | 公众号 QbitAI AI Agent又解锁了一个领域! 清华大学牵头,与西北工业大学以及上海AI lab等机构推出了电镜领域的AI agent——AutoMat。 它相当于一位精准的“地图翻译官”,把原子级 STEM 图像自动转成标准 CIF 结构,并一步到位给出形成能等关键物性。 过去的人工流程被缩短到几分钟,真正...
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 没等来o3 Pro和GPT-5,隔壁谷歌的Gemini先更新了。 深夜,谷歌通过等多个账号同时官宣,Gemini 2.5 Pro再次推出新版本(0605)。 新版本在代码、推理等任务上的表现更上一层楼,在超难数据集“人类最后的考试”中以21.6%的成绩超过了o3。 在大模型竞技场上,新版Gemini也...
明敏 发自 凹非寺 量子位 | 公众号 QbitAI Qwen3深夜上新,Embedding系列全新登场! 它专为文本表征、检索与排序任务设计,旨在将文本(如句子、段落)转换为高质量的向量表示,以便在语义搜索、问答系统、推荐引擎等应用中更有效地处理和理解自然语言。 可用于文档检索、RAG、分类、情感分析、检索等任务。 它在Qwen3基础模型上训练而来,充...