论文标题: From Rankings to Insights: Evaluation Should Shift Focus from Leaderboard to Feedback 论文地址: https://arxiv.org/abs/2505.06698 项目主页: https://liudan193.github.io/Feedbacker/ 代...
自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。 去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-ViT,发布了首个国产全自研视频大模型 Vidu,打破国外技术垄断,支持一键生成 16 秒高清视频。 近期,腾讯混元、阿里通义万相等开源视频生成模型相继亮相,...
新智元报道 编辑:英智 桃子 【新智元导读】刚刚,全新AI基准测试工具xbench诞生,通过双轨评估体系和长青评估机制,追踪模型能力与实际场景价值。 随着基础模型的快速发展和AI Agent进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映AI的客观能力正变得越来越困难。 因此,构建更加科学、长效...
新智元报道 编辑:定慧 桃子 【新智元导读】OpenAI内部战略被法院文件意外揭露:从超级助手、品牌重塑,到基础设施扩容与对手博弈,ChatGPT正在进行一次全面进化升级。目标明确:成为年轻一代心中「最酷的智能体」。 OpenAI真正的野心终于曝光! 最近,泄露的一份法律文件揭示了OpenAI的雄心:终极目标是「占领用户的AI心智」—— ChatG...
一款全新的AI基准测试工具。 随着基础模型的快速发展和AI Agent进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映AI的客观能力正变得越来越困难。 因此,构建更加科学、长效和如实反映AI客观能力的评测体系,正在成为指引AI技术突破与产品迭代的重要需求。 有鉴于此,红杉中国今天正式推出一款全新的AI...
Character AI 是个不合时宜的故事,不再多聊。 但 Character AI 的火爆,让资本市场关注到一个新的人群:OC。Original Character,用户在虚拟世界构建的有自己生活与故事的独立个体。 2018 年诞生的 OC 游戏 Gacha Life,拥有超过 2 亿玩家。在应用商店的排名里,它常常与《原神》等游戏并列。Gacha L...
一水 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 激烈,着实激烈! 全球首个人形机器人格斗赛刚刚在杭州落下帷幕,战况那叫一个精彩纷呈。 贴身肉搏、侧身闪避、倒地后快速爬起…格斗技巧的十八般武艺通通拿出来了: 当然也不乏搞笑画风,有选手直接对着空气一通乱挥: 本次公开表演赛一共有四支参赛队伍,均使用了宇树科技G1人形机器人。 在经过两两PK后,最...
西风 发自 凹非寺 量子位 | 公众号 QbitAI 中国算力巨震,海光信息、中科曙光两大巨头官宣拟合并! 就在昨晚,上交所披露双方“关于筹划重大资产重组的停牌公告”: 正在筹划由海光信息通过向公司全体A股换股股东发行A股股票的方式换股吸收合并中科曙光,并发行A股股票募集配套资金。 根据公告,为保证公平信息披露,维护投资者利益,避免造成公司股价异常波动...
UAV-Flow Colosseo团队 投稿 量子位 | 公众号 QbitAI 论文链接:https://arxiv.org/abs/2505.15725 项目主页:https://prince687028.github.io/UAV-Flow/ 一句话就能让无人机起飞? 就像人类飞行员一样,听懂指令后立刻照做。 北航刘偲教授团队创新性地提出了语言引导...
作者 | 褚杏娟 近日,智元机器人重磅发布具身智能领域双重里程碑式突破:全球首个基于机器人动作序列驱动的具身世界模型 EVAC (EnerVerse-AC),以及具身世界模型评测基准 EWMBench。这两大创新成果现已全面开源,旨在构建“低成本模拟 – 标准化评测 – 高效迭代”的全新开发范式,持续赋能全球具身智能研究,加速技术落地与产业发展。 EVAC...