安爸-超级家庭
bg

AI进家庭

35%准确率蒸发!字节&华科WildDoc揭示多模态文档理解鲁棒性短板

在文档理解领域,多模态大模型(MLLMs)正以惊人的速度进化。从基础文档图像识别到复杂文档理解,它们在扫描或数字文档基准测试(如 DocVQA、ChartQA)中表现出色,这似乎表明 MLLMs 已很好地解决了文档理解问题。 然而,现有的文档理解基准存在两大核心缺陷: 脱离真实场景:现实中文档多为手机/相机拍摄的纸质文件或屏幕截图,面临光照不均、物理扭曲...

阅读:13 评论:0

天塌了!苹果刚刚证明:DeepSeek,o3,Claude等“推理”模型根本没有推理能力

最新重磅研究:苹果并不认为推理模型比标准 LLM有重大突破 最新研究《思考的幻觉:通过问题复杂性视角理解推理模型的优势与局限》中,苹果对“大型语言模型已经具备真正的逻辑思维能力——即真正的“推理能力”——这一普遍存在的假设提出了质疑。苹果公司的研究人员看到的并非认知领域的突破,而是一种幻觉:这些模型仅仅创造了思考的印象,而实际上并没有稳定、可理解的思维过程...

阅读:8 评论:0

6大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底

机器之心报道 编辑:杨文 还在让大模型写高考作文?有本事做高考数学卷子。 又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。考试一结束,「高考数学」、「新一卷数学大题 难」等词条就火速冲上微博热搜,考生们在评论区集体「哀嚎」:「大题写到怀疑人生」、「选择填空送分,大题送命」。 而自从生成式 AI 走红后,大模型「决战」高考...

阅读:10 评论:0

全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!

机器之心原创 作者:张倩 恭喜国内视频创作者!从此,大家又多了一个好用的 AI 视频生成工具。 「你们的产品到底什么时候在国内上线?」 最近,爱诗科技也体验了一把小说作者的待遇 —— 打开后台,发现私信全是「催上线」的信息。 这不免令人好奇,到底是什么样的产品,让国内用户如此期盼? 直到最近,这个谜底终于揭晓。如果你是一个拥有天马行空想象力的人,你一定...

阅读:8 评论:0

没想到,最Open的开源新模型,来自小红书

机器之心报道 编辑:杨文 迄今为止行业最大的开源力度。 在大模型上向来低调的小红书,昨天开源了首个自研大模型。 该模型名为 dots.llm1,是小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队研发的文本大模型。 它的参数不算最大,总参数量 142B,激活参数 14B,是一款中等规模的 MoE(Mixture o...

阅读:8 评论:0

扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。 该研究基于团队前期发布的 8B 扩散语言模型 LLaDA(国内率先做到真正可用的扩散语言模型,是后续很多研究的主干基础模型),探索了扩散语言模型的偏好对齐方法,提出了方差缩减的偏好优化方法 ...

阅读:8 评论:0

CS专业爆冷,失业率飙至全美第七!毕业生狂卷4年,投1000份简历换0 offer

新智元报道 编辑:Aeneas 【新智元导读】曾经最受欢迎的CS专业,刚刚爆冷:成为大学专业中失业率最高的专业之一,排名第七!现在,已经有无数毕业生现身说法表示,自己在四年前踩着热潮挤进这个大热门专业,如今毕业投出1000份简历却拿到0 offer,而几十万刀的学生贷款,已经沉重地压了过来。 谁能想到,曾经最受欢迎的大学专业,如今却拥有最高的失业率...

阅读:7 评论:0

“高考作文”热搜爆了!16款AI实测挑战,AI也会玩套路了?

16款AI来写高考作文题,谁写得最像人? 作者 | 江宇 编辑 | 漠影 智东西6月7日报道,2025年高考今日正式拉开帷幕,在高考语文结束后,#2025高考作文题#话题立即登顶热搜。 在全民关注的目光下,“让AI写高考作文”已然成为一种年度科技测评传统:不仅是检验中文大模型综合能力的窗口,也是一场科技与人文的现实碰撞。 智东西第一时间对当前主...

阅读:7 评论:0

在这场大会上,我们看到了AI进入物理世界后的样子|

四位图灵奖得主集结,悟界大模型开启AI物理与生命科学新纪元。 作者|王艺 编辑|栗子 6月7日,AI领域的顶级盛会——第七届北京智源大会在中关村国家自主创新示范区会议中心正式落下了帷幕。 「甲子光年」作为媒体全程参加了大会。整场大会参加下来,我们最明显的感受是,相较于往年的智源大会,本届智源大会亮点频频: 一是嘉宾量级更加重磅:本届大会邀请到了四位图...

阅读:7 评论:0

中外六大AI出战高考作文!实测结果出炉

DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o这六个中外的人工智能当“考生”,写作今年高考全国卷。 文|毛明江 黄心怡 朱凌 今日,2025年高考正式开考。《科创板日报》分别使用DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o这六个中外的人工智能语言模型当“考生”,尝试写一...

阅读:8 评论:0