安爸-超级家庭
bg

AI信息差

大模型“快答”能力堪忧?中科院推出S1-Bench,直击大推理模型快思考短板

大推理模型(LRM)在非常复杂或困难的任务中表现非凡,这依赖于其强大的系统 2 思维模式(深思熟虑的慢思考)。但在日常的使用中,大量用户提问的问题更多是系统 1 问题(这些问题可以直觉快速回答),他们期待模型尽快回答,而不是等待模型冗长的思考。 一些初期的示例级的探索反映出了 LRM 在这类问题上存在思考冗长的直观表现。这不仅消耗了更多无用资源,也大大降...

阅读:10 评论:0

3B逆袭7B巨头!Video-XL-Pro登顶长视频理解SOTA,单卡万帧准确率超98%

长视频理解是多模态大模型的核心能力之一,也是迈向通用人工智能(AGI)的关键一步。然而,现有的多模态大模型难以大规模训练超长视频,并且在处理长视频时,仍然面临性能差和效率低的双重挑战。 对此,上海交通大学、北京智源研究院、特伦托大学的联合研究团队推出了小时级的超长视频理解大模型 Video-XL-Pro,创新提出“重构式令牌压缩”技术,实现近一万帧视频的单...

阅读:13 评论:0

2025美国艺术与科学院院士出炉!中国物理巨匠王贻芳,ImageNet作者李凯当选

新智元报道 编辑:英智 好困 【新智元导读】2025年美国艺术与科学院院士公布,有在机器学习领域开疆拓土的学者,也有在神经科学方面深入钻研的专家,他们有着怎样令人惊叹的成果?来一同揭晓新科院士的风采。 2025年美国艺术与科学院新科院士公布! 2025年新选出的近250名院士来自全球16个国家,涵盖31个专业领域,分为数学与物理科学、生物科学、社会...

阅读:10 评论:0

突发!曝阿里通义薄列峰离职,此前为应用视觉团队负责人

衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 五一节后第一口瓜,曝阿里通义实验室高层人员离职变动! “互联网八卦小喇叭”等多个微信公众号爆料,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10),已于4月30日低调离职。 他曾带领团队做出通义App上全民舞王「兵马俑跳科目三」等爆款功能。 知情人士透露,他已经加入某互联网大厂,base美国,担任多...

阅读:12 评论:0

AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

新智元报道 来源:学术头条 【新智元导读】具身智能最大的挑战在于泛化能力,即在陌生环境中正确完成任务。最近,Physical Intelligence推出全新的π0.5 VLA模型,通过异构任务协同训练实现了泛化,各种家务都能拿捏。 近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦桌子等复杂任务。但机器人面临的最大挑战并...

阅读:11 评论:0

OpenAI大动静:放弃盈利性转型,30亿美元收购Windsurf

本篇文章部分内容转载自公众号「腾讯科技」 当地时间5月5日,OpenAI发布声明宣布对公司架构进行调整,放弃将公司转向营利性组织的计划,将继续由非盈利组织控制。现有的营利性组织(LLC)将调整为公益责任公司(PBC)。 于此同时,彭博社今日发文称,据知情人士消息,OpenAI已同意以约30亿美元的价格收购AI编程公司Windsurf。若最终收购达成...

阅读:11 评论:0

三位北大校友突破65年数学难题!证明126维空间“末日假说”,为母校126周年献贺

梦晨 一水 发自 凹非寺 量子位 | 公众号 QbitAI 65年数学难题新突破! 来自复旦大学的林伟南、王国祯以及UCLA的徐宙利合作,解决了126维空间的Kervaire不变量问题。 三位作者都是北大数院出身,该成果曾作为北大建校126周年贺礼做报告,现在完整论文终于上传arXiv。 △图源:北京大学数学科学学院 他们这次解决的是高维拓扑学中的核心难题...

阅读:12 评论:0

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 谢赛宁十年前被NeurIPS_(当时还叫NIPS)_拒收的论文,刚在今年获得了AISTATS 2025年度时间检验奖。 这篇论文就是《Deeply-Supervised Nets》(DSN,深度监督网络),2014年9月挂上arXiv。 时间匆匆,十一年过去,属于是真·时间检验了。 它提出的中间层监督思...

阅读:11 评论:0

大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%

BrowseComp-ZH团队 投稿 量子位 | 公众号 QbitAI 你以为大模型已经能轻松“上网冲浪”了? 新基准测试集BrowseComp-ZH直接打脸主流AI。 BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”: GPT-4o在测试中准确率仅6.2%...

阅读:11 评论:0

马斯克 KO 奥特曼!一群前员工倒戈、各界组织助攻,OpenAI 认怂:世界变了,我们不改了!

整理 | 华卫 昨日,OpenAI 宣布,其成立之初是一家非营利组织,如今将继续由非营利组织监督和管控。 据 OpenAI 董事会主席 Bret Taylor 称,这一决定是“在听取了市政领导的意见,并与特拉华州总检察长办公室和加利福尼亚州总检察长办公室进行了建设性对话之后”做出的。具体而言,OpenAI 针对公司之后的架构演进制定了一项新计划: Op...

阅读:12 评论:0