本文探讨了AI发展的两个阶段,前半段聚焦于模型训练方法,后半段将转向问题定义和评估。“我们正处于 AI 的中场休息时间。 几十年来,人工智能主要致力于开发新的训练方法和模型。而且,它确实取得了成功:从击败国际象棋和围棋世界冠军,到在 SAT 和律师资格考试中超越大多数人类,再到斩获 IMO 和 IOI 金牌。这些载入史册的里程碑——深蓝、AlphaGo、GP...
音视频问答(Audio-Visual Question Answering, AVQA)是一项具有挑战性的多模态推理任务,需要智能系统理解音频-视频输入,准确回答自然语言查询。 然而,现有的 AVQA 方法由于鲁棒性不足,容易学习到训练数据集中的分布偏差,导致在分布外数据上性能表现不佳。此外,当前的数据集也无法全面有效地诊断这些方法的鲁棒性。 为了应对这些...
概况 双目立体匹配是计算机视觉中几十年来经久不衰的一个研究课题,其主要是从矫正的左右目图像中恢复稠密的匹配视差。进入深度学习时代后, 双目匹配的准确度和鲁棒性都得到了稳步的提高。 然而,现在模型仍然受到搜索准确的稠密匹配的一些固有难点的约束,如遮挡(在右图中匹配点没有直接展现),弱纹理/图像模糊/不良曝光(造成匹配难以准确定位),以及高分辨(往往伴随...
为什么要做 xVerify? 当前推理模型( Reasoning Model)在多个领域取得了显著进展,但在长推理链、 困难数学表达式、多语言等复杂场景下,答案抽取与验证仍面临以下挑战: 慢思考场景:长推理链包含阶段性结果和自我反思等过程,识别和判断其正确性较为复杂。 表达多样性:复杂数学表达(LaTeX / 分数 / 自然语言)、多语言描述的答案等价...
新智元报道 编辑:犀牛 KingHZ 【新智元导读】AI的野心从未如此大胆!新创公司Mechanize目标直指「全面自动化所有工作」和「经济无人化」,瞄准全球60万亿美元的劳动力市场。从虚拟工作环境到强化学习,Mechanize计划用AI智能体取代人类岗位,引发巨大争议。 看来AI真要来抢所有人的饭碗了! 有人来真的了。 最近,Epoch AI 创...
4月19日举行的全球首个人形机器人半程马拉松比赛持续刷屏,相关微博热搜超23个,话题阅读量超23亿。 据主办方19日晚公布的最新数据,在21.0975公里长的赛道上,北京人形机器人创新中心研制的天工Ultra最先冲线完赛,夺得冠军,总用时2小时40分42秒;第二名(亚军)来自小顽童队的松延动力N2机器人,最终用时3时37分50秒;第三名(季军)来自上海卓益...
中信出版社 投稿 量子位 | 公众号 QbitAI “10年后,机器人将可能比人都多,会陆续进入工厂、社会,最终形态是进入家庭。未来每个人、每个家庭都有机器人。” 这样的预言,来自清华大学智能产业研究院(AIR)院长张亚勤。 在其新书《智能涌现》中,基于数十年对AI的思考与实践,从他领导下AIR研究院正在推进的三大方向——多模态大模型、自动驾驶和生物智能出发...
生境科技投稿 量子位 | 公众号 QbitAI 具身智能的突破离不开高质量数据。 现实数据采集成本实在太高,于是,合成数据的技术就显得尤为重要。 目前,具身合成数据有两条主要技术路线之争:“视频合成+3D重建”or “端到端3D生成”。 参考自动驾驶的成功经验,前者模态转换链路过长容易导致误差累积;后者“直接合成3D数据”理论上有信息效率优势,但需要克服“常...
金磊 一水 发自 凹非寺 量子位 | 公众号 QbitAI 真·见证历史了。 全球首个人形机器人半程马拉松在北京亦庄开跑,足足21公里。 火爆程度,就连央视都现场直播,话题更是冲上了微博热搜。 这次半马,一共有20个人形机器人与1.2万人类共同参赛,而在比赛开始2小时40分42秒之后,这个“全球首个”的比赛冠军诞生了—— 来自北京人形机器人创新中心的全尺寸...
作者 | Steve Rosenbaum 译者 | 核子可乐 策划 | 褚杏娟 “山姆,考虑到你所参与创造的是一项将要重塑我们整个物种命运的技术,那么你做这件事的伦理依据和权威性来源是什么?如果你搞错了,又打算如何承担这份责任?” 这个悬而未决的问题面了本届温哥华 TED 2025 大会的一根利刺,亦是 TED 创始人克里斯·安德森向 ChatGPT...