安爸-超级家庭
bg

AI信息差

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。 在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。 目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。 而未针对定理...

阅读:8 评论:0

AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

新智元报道 编辑:编辑部 ZJH 【新智元导读】刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。 已经有越来越多的人发现:大模型排行榜LMArena,可能已经被大厂们玩坏了!...

阅读:10 评论:0

大模型从“胡说八道”升级为“超级舔狗”,网友:再进化就该上班了

作者|冬梅、核子可乐 一日为谄媚者, 终身为谄媚者 近日,OpenAI 在其官网发文称已回滚上周 ChatGPT 中的 GPT-4o 更新,目前用户使用的是行为更加平衡的早期版本。Altam 也在 X 上发帖说明了这一调整。 为什会做这样的调整?因为最近不少用户发现 ChatGPT 越来越“谄媚”。 随着用户对于 ChatGPT “谄媚”行为的讨论越来...

阅读:8 评论:0

设计即合规: 开放AI生态中的用户数据治理实践

Hugging Face Hub 已成为 AI 协作的核心平台,托管了数万个模型、数据集以及交互式应用程序 (Hugging Face Space)。 在开放生态系统中,用户知情同意的管理方式与那些更 “数据饥渴” 的科技公司的封闭产品截然不同。本文将通过分析 Hugging Face Hub 平台,探讨由官方主导项目与社区自主贡献中的用户同意实践模式。与传...

阅读:10 评论:0

3.6B参数逆袭7B巨头!北航开源TinyLLaVA-Video-R1:小模型竟靠强化学习吊打大模型?

随着人工智能技术的飞速发展,多模态模型在视频理解、问答等领域取得了显著进展。然而,大多数研究依赖于大规模模型,这对计算资源有限的研究者来说存在较高门槛。此外,高质量的推理数据稀缺,也限制了模型推理能力的提升。为了打破这些限制,北京航空航天大学的研究团队推出了一款名为TinyLLaVA-Video-R1 的小尺寸视频推理模型。该模型不仅开源了模型权重、代码和...

阅读:9 评论:0

不是 R2,不是 V4,DeepSeek 却悄悄放了个 6710 亿参数的狠活

好消息,DeepSeek 发布新模型了! 坏消息,不是小可爱们心心念念的 DeepSeek-R2 和 DeepSeek-V4。 而是一个专注于数学证明和复杂推理的模型:DeepSeek-Prover-V2-671B。 此次新模型的发布并开源延续了 DeepSeek 一如既往的低调。 没有任何预热和宣传,Hugging Face 上的 DeepSeek 开源...

阅读:8 评论:0

以唯物主义哲学为基础,毛选到底在告诉我们什么?

“ 毛选的核心就一句话,怎么发现问题,分析问题,以及怎么解决问题 ” 认识自身的客观条件 立足于自身的客观条件 去发现问题 然后解决问题 然后找到目前主要矛盾和次要矛盾,然后通过调查实践的方式去解决问题 最近在看《毛泽东选集》虽然看的也不是很明白,甚至很多时候觉得无聊;但看了一段时间之后,却发现了一些不可名状的感悟。 在学生时代学习政治和近代史是一件很无...

阅读:9 评论:0

【书单】没有这6大底座,别谈AI转型!真正阻碍企业进化的,是过时的思维方式!

五一快乐!在这个难得的假期里,别忘了给自己充充电。休息是为了走更远的路,而学习,正是我们通往未来的最好投资。趁着节日的松弛时光,不妨读一本好书,为大脑“加油”,也为自己在AI时代的职场竞争中积蓄力量。 当下,AI 正以前所未有的速度重塑我们所熟知的世界。它正在颠覆每一个行业、每一个岗位,也在重塑企业竞争的规则。从制造到金融,从零售到医疗,无一不在进行一场以...

阅读:8 评论:0

OpenAI也开始“带货”了

作者|沐风 来源|AI先锋官 4月29日,OpenAI宣布已对ChatGPT搜索进行了多项改进,推出全新的购物体验。 另外,OpenAI还称ChatGPT搜索已成为其最受欢迎且增长最快的功能之一,仅在过去的一周内就进行了10亿次的网络搜索。 新上线的功能可以让用户在ChatGPT与对话中直接进行商品搜索、比较和购买。 比如,用户只需输入“在200美元...

阅读:10 评论:0

深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙

新智元报道 编辑:编辑部 JZH 【新智元导读】就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径! 就在刚刚,DeepSeek-Prover-V2正式发布。 此次DeepSeek-Prover-V2提供了两种模型尺寸...

阅读:11 评论:0