安爸-超级家庭
bg

AI信息差

物理世界大考翻车?STI-Bench揭多模态大模型短板:顶尖模型准确率不足42%

多模态大语言模型(MLLM)作为具身智能(Embodied AI)和自动驾驶(Autonomous Driving)的端到端解决方案已成为主流趋势,并在视觉语义理解任务中取得了显著进展。 然而,它们在现实世界应用中执行精确、定量时空理解(例如估计和预测物体的外观、姿态、位移和运动)的能力很大程度上未经检验,这使得它们在物理世界交互中的前景充满不确定性。 为...

阅读:10 评论:0

刚刚,OpenAI发布最强推理模型o3!图像深度思考首秀,开源编程智能体已揽5k+star

机器之心报道 机器之心编辑部 深夜,OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。该系列模型经过训练,会在响应之前进行更长时间的思考。 OpenAI 表示,这是他们迄今为止发布的最智能模型,也标志着 ChatGPT 能力的巨大飞跃。 这次新发布的推理模型能够像智能体一样使用并组合 ChatGPT 中的每一个工具 —— 这包括搜索互联...

阅读:14 评论:0

豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1

字节放出推理模型大招。 作者 | 陈骏达 编辑 | 心缘 智东西4月17日报道,今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平。 在数学、编程、科学领域,豆包1.5·深度思考模型的测试表现超过DeepSeek-R1、QwQ-32B等国产推理模型,与O...

阅读:11 评论:0

4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理

当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率,这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力。 然而,当前视觉模型预训练很难提升到更高的分辨率,核心原因在于计算代价过于高昂。比如 SigLIP,在预训练过程中需...

阅读:12 评论:0

o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实

新智元报道 编辑:编辑部 ZJN 【新智元导读】OpenAI新模型全网实测惊艳来袭!o3缩放图像被玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役已经重回榜首,甚至有经济学家直言AGI已经来临! 昨夜o3的发布,让人不尽感慨:打了这么久嘴炮的OpenAI,这回终于实实在在拿出了点真东西。 史上首次...

阅读:11 评论:0

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。 论文主页: https://madaoer.github.io/projects/physically\_plausible\_video\_generation/ 论文链接: https...

阅读:10 评论:0

异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底

新智元报道 编辑:犀牛 英智 【新智元导读】悬疑小说的最后一页,隐藏着罪犯的真相。《逆转裁判》的法庭上,真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台,o1、Gemini 2.5 Pro等模型化身「侦探」,测试AI的推理极限。 当谈到AI为何能从「预测下一个词」中诞生智慧时,Ilya Sutskever曾用一个生动的比喻来解释。 想象你...

阅读:11 评论:0

从思考到行动:大模型自主工具调用能力的深度实现

本项目由复旦大学知识工场实验室肖仰华教授、梁家卿青年副研究员领导,博士生韩槿一,硕士生李廷云、熊程元、姜子上、王昕奕等同学共同参与完成。 GPT – 4o、Deepseek – R1 等高级模型已展现出令人惊叹的「深度思考」能力:理解上下文关联、拆解多步骤问题、甚至通过思维链(Chain – of – Thought)进行自我验证、自我反思等推理过程。 但...

阅读:10 评论:0

OpenAI收购Context.ai团队|每日并购

TIPS 1、下载 91 并购 APP,实时跟踪国内外一级市场并购事件。 2、转载请注明来源自 IT 桔子(itjuzi521),侵权必究。 3、建立“并购速递”长期发布合作,请发邮件到 hello@itjuzi.com。 2025 年 4 月 16 日 IT桔子(itjuzi521) 收录 1 起并购事件 国外并购事件 1. OpenAI收购Context...

阅读:12 评论:0

一家智能医疗服务商完成千万级元天使轮融资|投资速递

TIPS 1、下载 IT桔子 APP,实时跟踪国内外一级市场投融资事件。 2、转载请注明来源自 IT 桔子(itjuzi521),侵权必究。 3、建立“投资速递”长期发布合作,请发邮件到 hello@itjuzi.com。 2025 年 4 月 16 日 IT 桔子(itjuzi521) 收录 29 起投资/IPO排队事件 清治智能完成千万级人民币天使轮融资...

阅读:11 评论:0