Ilya Sutskever离开OpenAI后首次亮相! 近日,他回到他的母校多伦多大学,作为荣誉博士获得者进行了演讲。 他表示,如今的AI已经极大地改变了学生们的学习方式,并开始以未知和不可预测的方式影响着我们的工作和职业。 他认为,终有一天,AI将能做到我们现在能做的一切。不仅是部分事情,而是所有事情。任何我能学会的东西,任何你们任何一个人能学会的东西...
2025 智源大会,新一代「面壁小钢炮」 MiniCPM4.0 端侧模型发布。一款 8B 稀疏闪电版,带来端侧性能创新式大跃升;一款 0.5B 实力演绎以小博大,适配广泛终端场景。 MiniCPM4.0 -8B 是首个原生稀疏模型,5% 的极高稀疏度加持系统级创新技术的大爆发,长文本推理速度 5 倍常规加速,让长文本、深思考在端侧真正跑起来,宣告了端侧长文...
继作者团队此前对经典图神经网络(GNNs)在节点分类任务中的研究 [1],本研究进一步探讨了经典 GNNs 在图分类与图回归任务中的潜力。 为此,本文通过提出 GNN+ 框架,将六项常用超参数技术(边特征、归一化、Dropout、残差连接、FFN 和位置编码)集成进经典 GNNs 架构中(包括 GCN、GIN 和 GatedGCN),以全面重估其性能表现。...
近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。然而,一个关键问题仍然值得追问: 多模态大模型(MLLMs),真的能“看懂图”了吗? 特别是在面对结构复杂、细节密集的图像时,它们是否具备细粒度视觉理解与空间推理能力?我们又该如何系统评估这一能力? 为此,我们提出一个全新的评测基准 —— Reason...
允中 发自 凹非寺 量子位 | 公众号 QbitAI 2025年6月,由杭州市拱墅区人民政府、中国人工智能学会、中欧人才交流与创新合作中心联合主办的“智汇运河·智算未来”全球人工智能创新创业大赛即将重磅启幕。 大赛聚焦人工智能前沿领域,面向全球征集优质项目,旨在通过“以赛引才、以赛促创”模式,推动海内外顶尖技术与产业资源汇聚杭州拱墅,助力打造具有国际影响力的...
GSPN团队 投稿 量子位 | 公众号 QbitAI 视觉注意力机制,又有新突破,来自香港大学和英伟达。 Transformer的自注意力在NLP和计算机视觉领域表现出色——它能捕捉远距离依赖,构建深度上下文。然而,面对高分辨率图像时,传统自注意力有两个大难题: 计算量巨大:O(N²) 的复杂度让处理长上下文变得非常耗时。 破坏空间结构:将二维图像拉平成一...
FlowDirector团队 投稿 量子位 | 公众号 QbitAI 传统的视频编辑工作流,正在被AI彻底重塑。 AI的视频编辑方法总是存在一些问题:例如视频运动不连贯、编辑后的视频产生意外变化等……经过分析,这些问题的产生最终大都指向同一原因——反演-编辑范式。 因此,西湖大学AGILab提出了一种全新的无需反演和训练的视频编辑新方法:FlowDirect...
北大邓小铁课题组 投稿 量子位 | 公众号 QbitAI 给大模型当老师,让它一步步按你的想法做数据分析,有多难? 结果是,连Claude-3.7和Gemini-2.5 Pro这样的顶尖选手,都开始“不听话”了。 在一个全新的测试基准中,它们面对多轮、不断演进的指令,最终的任务成功率最高仅有40%。 这项名为IDA-Bench的新基准,就是为了模拟真实世界中...
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 一度轰动物理学界的「μ子异常」,凉了。 美国费米实验室公布的最新实验结果显示: 尽管在2021年,研究人员发现μ子的磁性超出理论预测0.1%,令粒子物理标准模型笼上一朵阴云。 但他们的「最终」测试结果指出,并未发现新的显著偏差。 也就是说,一切仍与标准模型相符,此前被认为可能颠覆粒子物理学的「异常」并不成...
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 1.93bit量化之后的 DeepSeek-R1(0528),编程能力依然能超过Claude 4 Sonnet? 最新优化版R1在编程榜单aider上取得了60%的成绩,不仅超过了Claude 4 Sonnet的56.4分,也超过了1月版的满血R1。 并且aider是一个接近现实软件工程任务的榜单,不是...